Developing state of the art document intelligence models.
11
Repository pubblici
68.769
Stelle totali
706
Follower
L'organizzazione datalab-to su GitHub è focalizzata sullo sviluppo di modelli di intelligenza documentale all'avanguardia. Utilizza principalmente Python, Shell e HTML e presenta una vasta gamma di repository pubblici, tra cui marker, surya e chandra, che offrono funzionalità avanzate per l'analisi e l'estrazione di dati da documenti.
Convert PDF to markdown + JSON quickly with high accuracy
OCR, layout analysis, reading order, table recognition in 90+ languages
OCR model that handles complex tables, forms, handwriting with full layout.
Extract structured text from pdfs quickly
Nessuna descrizione fornita per questo repository.
An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)
Scripts to run Datalab's self-service on-prem container
Nessuna descrizione fornita per questo repository.
Nessuna descrizione fornita per questo repository.
Nessuna descrizione fornita per questo repository.
Nessuna descrizione fornita per questo repository.
Datalab-to sviluppa strumenti e modelli per l'intelligenza documentale, inclusi progetti come marker, che converte PDF in markdown, e surya, che offre capacità di riconoscimento ottico dei caratteri in oltre 90 lingue.
L'organizzazione utilizza principalmente Python, Shell e HTML per i suoi progetti. Questi linguaggi supportano le sue iniziative nel campo dell'analisi dei documenti e dell'estrazione dei dati.
Sì, tutti i repository di datalab-to sono pubblici su GitHub. Ciò consente a chiunque di accedere e contribuire ai progetti, promuovendo la collaborazione nella comunità di sviluppo software.
Monitora Datalab con RepoGuard e ricevi un avviso nel momento in cui appare un nuovo repository pubblico.
Monitora questo account