Zaktualizowane 10 h ago

Organization

Publiczne ślady GitHub Datalab

@datalab-to

Zobacz profil na GitHubie

Developing state of the art document intelligence models.

United States of America

Publiczne repozytoria

68 769

Łączna liczba gwiazdek

706

Obserwujący

Datalab to organizacja, która koncentruje się na tworzeniu modeli inteligencji dokumentów. Na ich koncie GitHub znajduje się szeroki zakres repozytoriów, głównie w języku Python, z takimi projektami jak marker, surya i chandra, które obsługują przetwarzanie dokumentów i OCR.

Najpopularniejsze języki

Python 8Shell 1HTML 1

Publiczne repozytoria

marker

★36 046

Convert PDF to markdown + JSON quickly with high accuracy

Python

Zaktualizowane 13 cze 2026

surya

★20 794

OCR, layout analysis, reading order, table recognition in 90+ languages

Python

Zaktualizowane 13 cze 2026

chandra

★11 193

OCR model that handles complex tables, forms, handwriting with full layout.

Python

Zaktualizowane 13 cze 2026

pdftext

★695

Extract structured text from pdfs quickly

Python

Zaktualizowane 9 cze 2026

sdk

★11

Brak opisu dla tego repozytorium.

Python

Zaktualizowane 4 cze 2026

docext

★11

An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)

Nieznany język

Zaktualizowane 28 mar 2026

datalab-on-prem

★9

Scripts to run Datalab's self-service on-prem container

Shell

Zaktualizowane 11 cze 2026

inference-mirror

★4

Brak opisu dla tego repozytorium.

Python

Zaktualizowane 28 mar 2026

pykatex

★3

Brak opisu dla tego repozytorium.

Python

Zaktualizowane 8 cze 2026

results

★2

Brak opisu dla tego repozytorium.

HTML

Zaktualizowane 13 kwi 2026

oss_container

★1

Brak opisu dla tego repozytorium.

Python

Zaktualizowane 20 sty 2026

Najczęściej zadawane pytania

Co buduje datalab-to na GitHubie?

Datalab-to tworzy różnorodne projekty związane z inteligencją dokumentów, w tym narzędzia do konwersji formatów, analizy układu i rozpoznawania tekstu. Ich najpopularniejsze repozytoria to marker i surya.

Jakie języki programowania wykorzystuje datalab-to?

Datalab-to używa głównie języków Python, Shell i HTML. Projekty w Pythonie dominują w ich repozytoriach, co odzwierciedla ich skoncentrowanie na przetwarzaniu danych i sztucznej inteligencji.

Czy repozytoria datalab-to są publiczne?

Tak, wszystkie repozytoria datalab-to są publiczne. Dzięki temu każdy może przeglądać ich kod i przyczyniać się do rozwoju projektów związanych z inteligencją dokumentów.

Czy to ujawnienie jest zamierzone?

Monitoruj Datalab z RepoGuard i otrzymuj powiadomienia w momencie, gdy pojawi się nowe publiczne repozytorium.

Monitoruj to konto