Mis à jour 10 h ago

Organization

Empreinte publique GitHub de Datalab

@datalab-to

Voir le profil sur GitHub

Developing state of the art document intelligence models.

United States of America

Dépôts publics

68 769

Total des étoiles

706

Abonnés

L'organisation Datalab-to sur GitHub se concentre sur le développement de modèles d'intelligence documentaire de pointe. Elle maintient plusieurs dépôts publics, principalement en Python, Shell et HTML, incluant des projets notables comme marker, surya et chandra, qui abordent des tâches complexes d'OCR et de traitement de documents.

Langues principales

Python 8Shell 1HTML 1

Dépôts publics

marker

★36 046

Convert PDF to markdown + JSON quickly with high accuracy

Python

Mis à jour 13 juin 2026

surya

★20 794

OCR, layout analysis, reading order, table recognition in 90+ languages

Python

Mis à jour 13 juin 2026

chandra

★11 193

OCR model that handles complex tables, forms, handwriting with full layout.

Python

Mis à jour 13 juin 2026

pdftext

★695

Extract structured text from pdfs quickly

Python

Mis à jour 9 juin 2026

sdk

★11

Aucune description fournie pour ce dépôt.

Python

Mis à jour 4 juin 2026

docext

★11

An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)

Langue inconnue

Mis à jour 28 mars 2026

datalab-on-prem

★9

Scripts to run Datalab's self-service on-prem container

Shell

Mis à jour 11 juin 2026

inference-mirror

★4

Aucune description fournie pour ce dépôt.

Python

Mis à jour 28 mars 2026

pykatex

★3

Aucune description fournie pour ce dépôt.

Python

Mis à jour 8 juin 2026

results

★2

Aucune description fournie pour ce dépôt.

HTML

Mis à jour 13 avr. 2026

oss_container

★1

Aucune description fournie pour ce dépôt.

Python

Mis à jour 20 janv. 2026

Questions fréquemment posées

Quels types de projets Datalab-to développe-t-il sur GitHub ?

Datalab-to développe une variété de projets sur GitHub, notamment des outils d'OCR, d'extraction de données et de conversion de documents. Ses dépôts incluent des outils comme marker pour la conversion de PDF et surya pour l'analyse de mise en page.

Quelles langues de programmation utilise Datalab-to ?

Datalab-to utilise principalement Python, Shell et HTML pour ses projets. Python est prédominant, surtout dans les dépôts orientés vers l'intelligence documentaire et le traitement de texte.

Les dépôts de Datalab-to sont-ils publics ?

Oui, tous les dépôts de Datalab-to sont publics sur GitHub. Cela permet à la communauté de consulter et de contribuer aux projets liés à l'intelligence documentaire et à l'OCR.

Cette exposition est-elle intentionnelle ?

Surveillez Datalab avec RepoGuard et soyez alerté dès qu'un nouveau dépôt public apparaît.

Surveiller ce compte