Developing state of the art document intelligence models.
11
Repositorios públicos
68.769
Total de estrellas
706
Seguidores
La organización Datalab en GitHub se dedica al desarrollo de modelos de inteligencia documental de vanguardia. Sus repositorios incluyen herramientas como marker y surya, que utilizan principalmente Python, Shell y HTML, reflejando su enfoque en la extracción y análisis de datos de documentos.
Convert PDF to markdown + JSON quickly with high accuracy
OCR, layout analysis, reading order, table recognition in 90+ languages
OCR model that handles complex tables, forms, handwriting with full layout.
Extract structured text from pdfs quickly
No se proporcionó descripción para este repositorio.
An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)
Scripts to run Datalab's self-service on-prem container
No se proporcionó descripción para este repositorio.
No se proporcionó descripción para este repositorio.
No se proporcionó descripción para este repositorio.
No se proporcionó descripción para este repositorio.
Datalab-to desarrolla una variedad de herramientas relacionadas con la inteligencia documental, incluyendo proyectos como marker para convertir PDF a markdown y surya para reconocimiento óptico de caracteres en múltiples idiomas.
Datalab-to utiliza principalmente Python, Shell y HTML en sus proyectos. Estas lenguas permiten el desarrollo de soluciones eficientes para la extracción y análisis de datos de documentos.
Sí, todos los repositorios de datalab-to son públicos. Esto permite a los usuarios acceder a su código y colaborar en proyectos relacionados con la inteligencia documental.
Monitorea a Datalab con RepoGuard y recibe alertas en el momento en que aparece un nuevo repositorio público.
Monitorea esta cuenta