Developing state of the art document intelligence models.
11
सार्वजनिक रिपोजिटरी
68,769
कुल सितारे
706
अनुयायी
Datalab, एक संगठन है जो सार्वजनिक GitHub पर अपने विकासशील दस्तावेज़ बुद्धिमत्ता मॉडलों के लिए जाना जाता है। उनके पास Python, Shell और HTML जैसी प्राथमिक भाषाओं में कई सार्वजनिक रिपॉजिटरी हैं। प्रमुख प्रोजेक्ट्स में marker, surya, और chandra शामिल हैं, जो दस्तावेज़ों के प्रबंधन के लिए उन्नत समाधान प्रदान करते हैं।
Convert PDF to markdown + JSON quickly with high accuracy
OCR, layout analysis, reading order, table recognition in 90+ languages
OCR model that handles complex tables, forms, handwriting with full layout.
Extract structured text from pdfs quickly
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)
Scripts to run Datalab's self-service on-prem container
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
इस रिपोजिटरी के लिए कोई विवरण प्रदान नहीं किया गया।
datalab-to GitHub पर दस्तावेज़ बुद्धिमत्ता से संबंधित परियोजनाएँ बनाता है। उनके प्रमुख प्रोजेक्ट्स में marker, जो PDF को markdown में बदलता है, और surya, जो OCR और लेआउट विश्लेषण प्रदान करता है, शामिल हैं।
datalab-to मुख्य रूप से Python, Shell, और HTML जैसी प्रोग्रामिंग भाषाएँ उपयोग करता है। ये भाषाएँ उनके विभिन्न प्रोजेक्ट्स और टूल्स के लिए महत्वपूर्ण हैं, जैसे कि OCR और डेटा एक्सट्रैक्शन में।
हाँ, datalab-to के सभी रिपॉजिटरी सार्वजनिक हैं। यह संगठन अपनी परियोजनाओं को GitHub पर साझा करता है, जिससे अन्य डेवलपर्स और शोधकर्ता उनके विकास कार्य का लाभ उठा सकते हैं।
RepoGuard के साथ Datalab की निगरानी करें और जैसे ही एक नया सार्वजनिक रिपोजिटरी बनता है, सूचित हों।
इस खाते की निगरानी करें