Developing state of the art document intelligence models.
11
공개 저장소
68,769
총 별점
706
팔로워
Datalab은 GitHub에서 문서 인텔리전스 모델을 개발하는 조직으로, Python, Shell, HTML과 같은 다양한 프로그래밍 언어를 사용합니다. 이들은 marker, surya, chandra와 같은 여러 인기 있는 공용 리포지토리를 보유하고 있으며, 이들 리포지토리는 다양한 기능을 제공합니다.
Convert PDF to markdown + JSON quickly with high accuracy
OCR, layout analysis, reading order, table recognition in 90+ languages
OCR model that handles complex tables, forms, handwriting with full layout.
Extract structured text from pdfs quickly
이 저장소에 대한 설명이 제공되지 않았습니다.
An on-premises, OCR-free unstructured data extraction, markdown conversion and benchmarking toolkit. (https://idp-leaderboard.org/)
Scripts to run Datalab's self-service on-prem container
이 저장소에 대한 설명이 제공되지 않았습니다.
이 저장소에 대한 설명이 제공되지 않았습니다.
이 저장소에 대한 설명이 제공되지 않았습니다.
이 저장소에 대한 설명이 제공되지 않았습니다.
datalab-to는 문서 인텔리전스 모델을 개발하며, PDF 변환 및 OCR 관련 다양한 공용 리포지토리를 제공합니다. 이들은 복잡한 데이터를 처리하고 읽기 쉽게 변환하는 데 중점을 두고 있습니다.
datalab-to는 주로 Python, Shell, HTML을 사용하여 리포지토리를 개발합니다. 이 언어들은 데이터 처리 및 웹 기술에 강점을 가지고 있어, 다양한 프로젝트에 적합합니다.
네, datalab-to의 모든 리포지토리는 공개입니다. 사용자는 이 리포지토리들을 통해 Datalab의 연구 결과와 개발 작업을 쉽게 접할 수 있습니다.