Aktualisiert vor 10 h

Organization

Öffentlicher GitHub-Footprint von Datalab

@datalab-to

Profil auf GitHub ansehen

Developing state of the art document intelligence models.

United States of America

Öffentliche Repositories

68.769

Sterne gesamt

706

Follower

Die Organisation datalab-to auf GitHub entwickelt fortschrittliche Modelle zur Dokumentenintelligenz. Ihre öffentlichen Repositories umfassen eine Vielzahl von Projekten, darunter marker, surya und chandra, die sich mit der Konvertierung von PDFs und der optischen Zeichenerkennung in mehreren Sprachen befassen. Die Hauptprogrammiersprachen sind Python, Shell und HTML.

Top-Sprachen

Python 8Shell 1HTML 1

Öffentliche Repositories

marker

★36.046

Convert PDF to markdown + JSON quickly with high accuracy

Python

Aktualisiert 13. Juni 2026

surya

★20.794

OCR, layout analysis, reading order, table recognition in 90+ languages

Python

Aktualisiert 13. Juni 2026

chandra

★11.193

OCR model that handles complex tables, forms, handwriting with full layout.

Python

Aktualisiert 13. Juni 2026

pdftext

★695

Extract structured text from pdfs quickly

Python

Aktualisiert 9. Juni 2026

sdk

★11

Keine Beschreibung für dieses Repository vorhanden.

Python

Aktualisiert 4. Juni 2026

docext

★11

An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)

Unbekannte Sprache

Aktualisiert 28. März 2026

datalab-on-prem

★9

Scripts to run Datalab's self-service on-prem container

Shell

Aktualisiert 11. Juni 2026

inference-mirror

★4

Keine Beschreibung für dieses Repository vorhanden.

Python

Aktualisiert 28. März 2026

pykatex

★3

Keine Beschreibung für dieses Repository vorhanden.

Python

Aktualisiert 8. Juni 2026

results

★2

Keine Beschreibung für dieses Repository vorhanden.

HTML

Aktualisiert 13. Apr. 2026

oss_container

★1

Keine Beschreibung für dieses Repository vorhanden.

Python

Aktualisiert 20. Jan. 2026

Häufige Fragen

Was entwickelt datalab-to auf GitHub?

Datalab-to entwickelt auf GitHub verschiedene Projekte zur Dokumentenintelligenz, einschließlich Tools zur PDF-Konvertierung und optischen Zeichenerkennung. Zu den bekanntesten Repositories gehören marker und surya.

Welche Programmiersprachen verwendet datalab-to?

Die Hauptprogrammiersprachen von datalab-to sind Python, Shell und HTML. Diese Sprachen unterstützen die Entwicklung ihrer Tools und Anwendungen zur Datenverarbeitung und Analyse.

Sind die Repositories von datalab-to öffentlich?

Ja, die Repositories von datalab-to sind öffentlich zugänglich. Dies ermöglicht es der Community, die Projekte zu nutzen, zu überprüfen und zur Verbesserung beizutragen.

Ist diese Sichtbarkeit gewollt?

Überwache Datalab mit RepoGuard und werde benachrichtigt, sobald ein neues öffentliches Repository auftaucht.

Diesen Account überwachen