Developing state of the art document intelligence models.
11
Dépôts publics
68 769
Total des étoiles
706
Abonnés
L'organisation Datalab-to sur GitHub se concentre sur le développement de modèles d'intelligence documentaire de pointe. Elle maintient plusieurs dépôts publics, principalement en Python, Shell et HTML, incluant des projets notables comme marker, surya et chandra, qui abordent des tâches complexes d'OCR et de traitement de documents.
Convert PDF to markdown + JSON quickly with high accuracy
OCR, layout analysis, reading order, table recognition in 90+ languages
OCR model that handles complex tables, forms, handwriting with full layout.
Extract structured text from pdfs quickly
Aucune description fournie pour ce dépôt.
An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)
Scripts to run Datalab's self-service on-prem container
Aucune description fournie pour ce dépôt.
Aucune description fournie pour ce dépôt.
Aucune description fournie pour ce dépôt.
Aucune description fournie pour ce dépôt.
Datalab-to développe une variété de projets sur GitHub, notamment des outils d'OCR, d'extraction de données et de conversion de documents. Ses dépôts incluent des outils comme marker pour la conversion de PDF et surya pour l'analyse de mise en page.
Datalab-to utilise principalement Python, Shell et HTML pour ses projets. Python est prédominant, surtout dans les dépôts orientés vers l'intelligence documentaire et le traitement de texte.
Oui, tous les dépôts de Datalab-to sont publics sur GitHub. Cela permet à la communauté de consulter et de contribuer aux projets liés à l'intelligence documentaire et à l'OCR.
Surveillez Datalab avec RepoGuard et soyez alerté dès qu'un nouveau dépôt public apparaît.
Surveiller ce compte