Developing state of the art document intelligence models.
11
Publiczne repozytoria
68 769
Łączna liczba gwiazdek
706
Obserwujący
Datalab to organizacja, która koncentruje się na tworzeniu modeli inteligencji dokumentów. Na ich koncie GitHub znajduje się szeroki zakres repozytoriów, głównie w języku Python, z takimi projektami jak marker, surya i chandra, które obsługują przetwarzanie dokumentów i OCR.
Convert PDF to markdown + JSON quickly with high accuracy
OCR, layout analysis, reading order, table recognition in 90+ languages
OCR model that handles complex tables, forms, handwriting with full layout.
Extract structured text from pdfs quickly
Brak opisu dla tego repozytorium.
An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)
Scripts to run Datalab's self-service on-prem container
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
Brak opisu dla tego repozytorium.
Datalab-to tworzy różnorodne projekty związane z inteligencją dokumentów, w tym narzędzia do konwersji formatów, analizy układu i rozpoznawania tekstu. Ich najpopularniejsze repozytoria to marker i surya.
Datalab-to używa głównie języków Python, Shell i HTML. Projekty w Pythonie dominują w ich repozytoriach, co odzwierciedla ich skoncentrowanie na przetwarzaniu danych i sztucznej inteligencji.
Tak, wszystkie repozytoria datalab-to są publiczne. Dzięki temu każdy może przeglądać ich kod i przyczyniać się do rozwoju projektów związanych z inteligencją dokumentów.
Monitoruj Datalab z RepoGuard i otrzymuj powiadomienia w momencie, gdy pojawi się nowe publiczne repozytorium.
Monitoruj to konto