đang làm mới…

Organization

Dấu chân GitHub công khai của tesseract-ocr

@tesseract-ocr

Xem hồ sơ trên GitHub

Tesseract OCR

Kho lưu trữ công khai

88.948

Tổng số sao

2.712

Người theo dõi

Tesseract-ocr là một tổ chức trên GitHub chuyên phát triển các công cụ nhận diện ký tự quang học (OCR) mã nguồn mở. Tổ chức này có một danh mục rộng lớn các kho chứa, bao gồm các ngôn ngữ chính như C++, Python, HTML và Ruby. Một số kho nổi bật như tesseract, tessdata và tessdoc được sử dụng rộng rãi trong cộng đồng phát triển.

Ngôn ngữ hàng đầu

HTML 2C++ 1Python 1Ruby 1Makefile 1Shell 1

Kho lưu trữ công khai

tesseract

★74.651

Tesseract Open Source OCR Engine (main repository)

C++

Đã cập nhật 13 thg 6, 2026

tessdata

★7.571

Trained models with fast variant of the "best" LSTM models + legacy models

Ngôn ngữ không xác định

Đã cập nhật 12 thg 6, 2026

tessdoc

★2.386

Tesseract documentation

HTML

Đã cập nhật 12 thg 6, 2026

tessdata_best

★1.561

Best (most accurate) trained LSTM models.

Ngôn ngữ không xác định

Đã cập nhật 12 thg 6, 2026

langdata

★869

Source training data for Tesseract for lots of languages

Ngôn ngữ không xác định

Đã cập nhật 28 thg 5, 2026

tesstrain

★722

Train Tesseract LSTM with make

Python

Đã cập nhật 12 thg 6, 2026

tessdata_fast

★603

Fast integer versions of trained LSTM models

Ngôn ngữ không xác định

Đã cập nhật 9 thg 6, 2026

docs

★267

Various documents related to Tesseract OCR

Ngôn ngữ không xác định

Đã cập nhật 22 thg 4, 2026

langdata_lstm

★127

Data used for LSTM model training

Ngôn ngữ không xác định

Đã cập nhật 9 thg 6, 2026

tesseract-ocr.github.io

★75

Tesseract documentation

Ruby

Đã cập nhật 16 thg 9, 2025

tessconfigs

★36

Tesseract Config files

Makefile

Đã cập nhật 10 thg 5, 2026

test

★35

Repository for tesseract testing

Shell

Đã cập nhật 24 thg 1, 2026

tessdata_contrib

★32

User contributed (non Google) OCR models for Tesseract

Ngôn ngữ không xác định

Đã cập nhật 12 thg 6, 2026

tessapi

★13

Tesseract source code and API documentation

HTML

Đã cập nhật 21 thg 12, 2023

Câu hỏi thường gặp

Tesseract-ocr xây dựng gì trên GitHub?

Tesseract-ocr phát triển các công cụ và mô hình nhận diện văn bản bằng quang học. Các dự án chính của họ bao gồm tesseract, tessdata và tessdoc, phục vụ cho nhiều ngôn ngữ và ứng dụng khác nhau.

Ngôn ngữ lập trình nào được tesseract-ocr sử dụng?

Tesseract-ocr chủ yếu sử dụng các ngôn ngữ lập trình như C++, Python, HTML và Ruby. Những ngôn ngữ này giúp họ phát triển các công cụ mạnh mẽ cho việc nhận diện văn bản.

Các kho chứa của tesseract-ocr có công khai không?

Có, tất cả các kho chứa của tesseract-ocr đều công khai trên GitHub. Điều này cho phép người dùng và nhà phát triển xem xét mã nguồn, đóng góp và cải thiện các dự án của tổ chức.

Liệu việc lộ thông tin này có dự định không?

Theo dõi tesseract-ocr với RepoGuard và nhận cảnh báo ngay khi có kho lưu trữ công khai mới xuất hiện.

Theo dõi tài khoản này