Tesseract-ocr là một tổ chức trên GitHub chuyên phát triển các công cụ nhận diện ký tự quang học (OCR) mã nguồn mở. Tổ chức này có một danh mục rộng lớn các kho chứa, bao gồm các ngôn ngữ chính như C++, Python, HTML và Ruby. Một số kho nổi bật như tesseract, tessdata và tessdoc được sử dụng rộng rãi trong cộng đồng phát triển.
Tesseract Open Source OCR Engine (main repository)
Trained models with fast variant of the "best" LSTM models + legacy models
Tesseract documentation
Best (most accurate) trained LSTM models.
Source training data for Tesseract for lots of languages
Train Tesseract LSTM with make
Fast integer versions of trained LSTM models
Various documents related to Tesseract OCR
Data used for LSTM model training
Tesseract documentation
Tesseract Config files
Repository for tesseract testing
User contributed (non Google) OCR models for Tesseract
Tesseract source code and API documentation
Tesseract-ocr phát triển các công cụ và mô hình nhận diện văn bản bằng quang học. Các dự án chính của họ bao gồm tesseract, tessdata và tessdoc, phục vụ cho nhiều ngôn ngữ và ứng dụng khác nhau.
Tesseract-ocr chủ yếu sử dụng các ngôn ngữ lập trình như C++, Python, HTML và Ruby. Những ngôn ngữ này giúp họ phát triển các công cụ mạnh mẽ cho việc nhận diện văn bản.
Có, tất cả các kho chứa của tesseract-ocr đều công khai trên GitHub. Điều này cho phép người dùng và nhà phát triển xem xét mã nguồn, đóng góp và cải thiện các dự án của tổ chức.
Theo dõi tesseract-ocr với RepoGuard và nhận cảnh báo ngay khi có kho lưu trữ công khai mới xuất hiện.
Theo dõi tài khoản này