Developing state of the art document intelligence models.
11
Öffentliche Repositories
68.769
Sterne gesamt
706
Follower
Die Organisation datalab-to auf GitHub entwickelt fortschrittliche Modelle zur Dokumentenintelligenz. Ihre öffentlichen Repositories umfassen eine Vielzahl von Projekten, darunter marker, surya und chandra, die sich mit der Konvertierung von PDFs und der optischen Zeichenerkennung in mehreren Sprachen befassen. Die Hauptprogrammiersprachen sind Python, Shell und HTML.
Convert PDF to markdown + JSON quickly with high accuracy
OCR, layout analysis, reading order, table recognition in 90+ languages
OCR model that handles complex tables, forms, handwriting with full layout.
Extract structured text from pdfs quickly
Keine Beschreibung für dieses Repository vorhanden.
An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)
Scripts to run Datalab's self-service on-prem container
Keine Beschreibung für dieses Repository vorhanden.
Keine Beschreibung für dieses Repository vorhanden.
Keine Beschreibung für dieses Repository vorhanden.
Keine Beschreibung für dieses Repository vorhanden.
Datalab-to entwickelt auf GitHub verschiedene Projekte zur Dokumentenintelligenz, einschließlich Tools zur PDF-Konvertierung und optischen Zeichenerkennung. Zu den bekanntesten Repositories gehören marker und surya.
Die Hauptprogrammiersprachen von datalab-to sind Python, Shell und HTML. Diese Sprachen unterstützen die Entwicklung ihrer Tools und Anwendungen zur Datenverarbeitung und Analyse.
Ja, die Repositories von datalab-to sind öffentlich zugänglich. Dies ermöglicht es der Community, die Projekte zu nutzen, zu überprüfen und zur Verbesserung beizutragen.
Überwache Datalab mit RepoGuard und werde benachrichtigt, sobald ein neues öffentliches Repository auftaucht.
Diesen Account überwachen