Actualizado 10 h ago

Organization

Huella pública de GitHub de Datalab

@datalab-to

Ver perfil en GitHub

Developing state of the art document intelligence models.

United States of America

Repositorios públicos

68.769

Total de estrellas

706

Seguidores

La organización Datalab en GitHub se dedica al desarrollo de modelos de inteligencia documental de vanguardia. Sus repositorios incluyen herramientas como marker y surya, que utilizan principalmente Python, Shell y HTML, reflejando su enfoque en la extracción y análisis de datos de documentos.

Principales lenguajes

Python 8Shell 1HTML 1

Repositorios públicos

marker

★36.046

Convert PDF to markdown + JSON quickly with high accuracy

Python

Actualizado 13 jun 2026

surya

★20.794

OCR, layout analysis, reading order, table recognition in 90+ languages

Python

Actualizado 13 jun 2026

chandra

★11.193

OCR model that handles complex tables, forms, handwriting with full layout.

Python

Actualizado 13 jun 2026

pdftext

★695

Extract structured text from pdfs quickly

Python

Actualizado 9 jun 2026

sdk

★11

No se proporcionó descripción para este repositorio.

Python

Actualizado 4 jun 2026

docext

★11

An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)

Idioma desconocido

Actualizado 28 mar 2026

datalab-on-prem

★9

Scripts to run Datalab's self-service on-prem container

Shell

Actualizado 11 jun 2026

inference-mirror

★4

No se proporcionó descripción para este repositorio.

Python

Actualizado 28 mar 2026

pykatex

★3

No se proporcionó descripción para este repositorio.

Python

Actualizado 8 jun 2026

results

★2

No se proporcionó descripción para este repositorio.

HTML

Actualizado 13 abr 2026

oss_container

★1

No se proporcionó descripción para este repositorio.

Python

Actualizado 20 ene 2026

Preguntas frecuentes

¿Qué construye datalab-to en GitHub?

Datalab-to desarrolla una variedad de herramientas relacionadas con la inteligencia documental, incluyendo proyectos como marker para convertir PDF a markdown y surya para reconocimiento óptico de caracteres en múltiples idiomas.

¿Qué lenguajes de programación utiliza datalab-to?

Datalab-to utiliza principalmente Python, Shell y HTML en sus proyectos. Estas lenguas permiten el desarrollo de soluciones eficientes para la extracción y análisis de datos de documentos.

¿Son públicos los repositorios de datalab-to?

Sí, todos los repositorios de datalab-to son públicos. Esto permite a los usuarios acceder a su código y colaborar en proyectos relacionados con la inteligencia documental.

¿Esta exposición es intencionada?

Monitorea a Datalab con RepoGuard y recibe alertas en el momento en que aparece un nuevo repositorio público.

Monitorea esta cuenta