Developing state of the art document intelligence models.
11
Publieke repositories
68.769
Totaal aantal sterren
706
Volgers
De organisatie Datalab, actief op GitHub onder de gebruikersnaam datalab-to, ontwikkelt geavanceerde documentintelligentie-modellen. Hun publieke aanwezigheid omvat een breed scala aan repositories, waaronder marker en surya, die respectievelijk gericht zijn op het converteren van PDF's naar markdown en het uitvoeren van OCR en lay-outanalyse in meer dan 90 talen. De primaire programmeertalen zijn Python, Shell en HTML.
Convert PDF to markdown + JSON quickly with high accuracy
OCR, layout analysis, reading order, table recognition in 90+ languages
OCR model that handles complex tables, forms, handwriting with full layout.
Extract structured text from pdfs quickly
Geen beschrijving gegeven voor deze repository.
An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)
Scripts to run Datalab's self-service on-prem container
Geen beschrijving gegeven voor deze repository.
Geen beschrijving gegeven voor deze repository.
Geen beschrijving gegeven voor deze repository.
Geen beschrijving gegeven voor deze repository.
Datalab-to bouwt verschillende projecten op GitHub die zich richten op documentintelligentie. Hun repositories omvatten tools zoals marker voor PDF-conversie en surya voor OCR en lay-outanalyse, wat bijdraagt aan hun expertise in het verwerken van ongestructureerde gegevens.
Datalab-to gebruikt voornamelijk Python, Shell en HTML voor hun projecten. Deze talen ondersteunen hun ontwikkeling van tools die zich richten op documentverwerking en gegevensextractie, zoals chandra en pdftext.
Ja, de repositories van datalab-to zijn openbaar. Dit betekent dat hun projecten, waaronder diverse hulpmiddelen voor documentintelligentie, toegankelijk zijn voor iedereen op GitHub, wat bijdraagt aan transparantie en samenwerking in de gemeenschap.
Monitor Datalab met RepoGuard en krijg een waarschuwing op het moment dat er een nieuwe publieke repository verschijnt.
Monitor dit account