Aggiornato 10 h ago

Organization

Impronta pubblica su GitHub di Datalab

@datalab-to

Visualizza profilo su GitHub

Developing state of the art document intelligence models.

United States of America

Repository pubblici

68.769

Stelle totali

706

Follower

L'organizzazione datalab-to su GitHub è focalizzata sullo sviluppo di modelli di intelligenza documentale all'avanguardia. Utilizza principalmente Python, Shell e HTML e presenta una vasta gamma di repository pubblici, tra cui marker, surya e chandra, che offrono funzionalità avanzate per l'analisi e l'estrazione di dati da documenti.

Lingue principali

Python 8Shell 1HTML 1

Repository pubblici

marker

★36.046

Convert PDF to markdown + JSON quickly with high accuracy

Python

Aggiornato 13 giu 2026

surya

★20.794

OCR, layout analysis, reading order, table recognition in 90+ languages

Python

Aggiornato 13 giu 2026

chandra

★11.193

OCR model that handles complex tables, forms, handwriting with full layout.

Python

Aggiornato 13 giu 2026

pdftext

★695

Extract structured text from pdfs quickly

Python

Aggiornato 9 giu 2026

sdk

★11

Nessuna descrizione fornita per questo repository.

Python

Aggiornato 4 giu 2026

docext

★11

An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)

Lingua sconosciuta

Aggiornato 28 mar 2026

datalab-on-prem

★9

Scripts to run Datalab's self-service on-prem container

Shell

Aggiornato 11 giu 2026

inference-mirror

★4

Nessuna descrizione fornita per questo repository.

Python

Aggiornato 28 mar 2026

pykatex

★3

Nessuna descrizione fornita per questo repository.

Python

Aggiornato 8 giu 2026

results

★2

Nessuna descrizione fornita per questo repository.

HTML

Aggiornato 13 apr 2026

oss_container

★1

Nessuna descrizione fornita per questo repository.

Python

Aggiornato 20 gen 2026

Domande frequenti

Cosa costruisce datalab-to su GitHub?

Datalab-to sviluppa strumenti e modelli per l'intelligenza documentale, inclusi progetti come marker, che converte PDF in markdown, e surya, che offre capacità di riconoscimento ottico dei caratteri in oltre 90 lingue.

Quali linguaggi di programmazione utilizza datalab-to?

L'organizzazione utilizza principalmente Python, Shell e HTML per i suoi progetti. Questi linguaggi supportano le sue iniziative nel campo dell'analisi dei documenti e dell'estrazione dei dati.

I repository di datalab-to sono pubblici?

Sì, tutti i repository di datalab-to sono pubblici su GitHub. Ciò consente a chiunque di accedere e contribuire ai progetti, promuovendo la collaborazione nella comunità di sviluppo software.

Questa esposizione è intenzionata?

Monitora Datalab con RepoGuard e ricevi un avviso nel momento in cui appare un nuovo repository pubblico.

Monitora questo account