Developing state of the art document intelligence models.
11
公開リポジトリ
68,769
合計スター
706
フォロワー
Convert PDF to markdown + JSON quickly with high accuracy
OCR, layout analysis, reading order, table recognition in 90+ languages
OCR model that handles complex tables, forms, handwriting with full layout.
Extract structured text from pdfs quickly
このリポジトリに関する説明は提供されていません。
An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)
Scripts to run Datalab's self-service on-prem container
このリポジトリに関する説明は提供されていません。
このリポジトリに関する説明は提供されていません。
このリポジトリに関する説明は提供されていません。
このリポジトリに関する説明は提供されていません。