Developing state of the art document intelligence models.
11
Repositori publik
68.769
Total bintang
706
Pengikut
Datalab adalah organisasi yang fokus pada pengembangan model kecerdasan dokumen yang canggih. Di GitHub, mereka memiliki berbagai repositori publik, termasuk proyek-proyek penting seperti marker untuk konversi PDF dan surya untuk analisis OCR dalam banyak bahasa. Datalab menggunakan bahasa pemrograman seperti Python, Shell, dan HTML dalam pengembangan perangkat lunak mereka.
Convert PDF to markdown + JSON quickly with high accuracy
OCR, layout analysis, reading order, table recognition in 90+ languages
OCR model that handles complex tables, forms, handwriting with full layout.
Extract structured text from pdfs quickly
Tidak ada deskripsi yang diberikan untuk repositori ini.
An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)
Scripts to run Datalab's self-service on-prem container
Tidak ada deskripsi yang diberikan untuk repositori ini.
Tidak ada deskripsi yang diberikan untuk repositori ini.
Tidak ada deskripsi yang diberikan untuk repositori ini.
Tidak ada deskripsi yang diberikan untuk repositori ini.
Datalab-to membangun berbagai proyek yang berfokus pada kecerdasan dokumen, termasuk repositori seperti marker untuk konversi PDF dan surya untuk analisis OCR yang mendukung banyak bahasa. Repositori ini berkontribusi pada pengembangan aplikasi yang meningkatkan pemrosesan dokumen.
Datalab-to terutama menggunakan bahasa pemrograman Python, Shell, dan HTML dalam pengembangan repositorinya. Bahasa-bahasa ini mendukung berbagai proyek yang berkaitan dengan kecerdasan dokumen dan ekstraksi data.
Ya, semua repositori yang dimiliki oleh datalab-to bersifat publik. Ini memungkinkan pengembang lain untuk mengakses, menggunakan, dan berkontribusi pada proyek-proyek yang tersedia di GitHub.
Pantau Datalab dengan RepoGuard dan dapatkan pemberitahuan saat repositori publik baru muncul.
Pantau akun ini