Developing state of the art document intelligence models.
11
Публичные репозитории
68 769
Всего звезд
706
Подписчики
Convert PDF to markdown + JSON quickly with high accuracy
OCR, layout analysis, reading order, table recognition in 90+ languages
OCR model that handles complex tables, forms, handwriting with full layout.
Extract structured text from pdfs quickly
Описание для этого репозитория не предоставлено.
An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)
Scripts to run Datalab's self-service on-prem container
Описание для этого репозитория не предоставлено.
Описание для этого репозитория не предоставлено.
Описание для этого репозитория не предоставлено.
Описание для этого репозитория не предоставлено.
Следите за Datalab с помощью RepoGuard и получайте уведомления в момент появления нового публичного репозитория.
Следить за этим аккаунтом