Обновлено 10 h ago

Organization

Публичный след на GitHub Datalab

@datalab-to

Просмотреть профиль на GitHub

Developing state of the art document intelligence models.

United States of America

Публичные репозитории

68 769

Всего звезд

706

Подписчики

Основные языки

Python 8Shell 1HTML 1

Публичные репозитории

marker

★36 046

Convert PDF to markdown + JSON quickly with high accuracy

Python

Обновлено 13 июн. 2026 г.

surya

★20 794

OCR, layout analysis, reading order, table recognition in 90+ languages

Python

Обновлено 13 июн. 2026 г.

chandra

★11 193

OCR model that handles complex tables, forms, handwriting with full layout.

Python

Обновлено 13 июн. 2026 г.

pdftext

★695

Extract structured text from pdfs quickly

Python

Обновлено 9 июн. 2026 г.

sdk

★11

Описание для этого репозитория не предоставлено.

Python

Обновлено 4 июн. 2026 г.

docext

★11

An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)

Неизвестный язык

Обновлено 28 мар. 2026 г.

datalab-on-prem

★9

Scripts to run Datalab's self-service on-prem container

Shell

Обновлено 11 июн. 2026 г.

inference-mirror

★4

Описание для этого репозитория не предоставлено.

Python

Обновлено 28 мар. 2026 г.

pykatex

★3

Описание для этого репозитория не предоставлено.

Python

Обновлено 8 июн. 2026 г.

results

★2

Описание для этого репозитория не предоставлено.

HTML

Обновлено 13 апр. 2026 г.

oss_container

★1

Описание для этого репозитория не предоставлено.

Python

Обновлено 20 янв. 2026 г.

Это раскрытие намеренно?

Следите за Datalab с помощью RepoGuard и получайте уведомления в момент появления нового публичного репозитория.

Следить за этим аккаунтом