A organização tesseract-ocr mantém uma presença significativa no GitHub, com uma variedade de repositórios públicos focados em OCR (Reconhecimento Óptico de Caracteres). Os principais repositórios incluem tesseract, um motor de OCR de código aberto em C++, e tessdata, que contém modelos treinados. As linguagens primárias utilizadas incluem HTML, C++, Python, Ruby, Makefile e Shell.
Tesseract Open Source OCR Engine (main repository)
Trained models with fast variant of the "best" LSTM models + legacy models
Tesseract documentation
Best (most accurate) trained LSTM models.
Source training data for Tesseract for lots of languages
Train Tesseract LSTM with make
Fast integer versions of trained LSTM models
Various documents related to Tesseract OCR
Data used for LSTM model training
Tesseract documentation
Tesseract Config files
Repository for tesseract testing
User contributed (non Google) OCR models for Tesseract
Tesseract source code and API documentation
A tesseract-ocr desenvolve ferramentas e modelos para reconhecimento óptico de caracteres, com repositórios notáveis como tesseract e tessdata, que fornecem funcionalidades e dados para treinar modelos de OCR.
Os repositórios da tesseract-ocr utilizam uma variedade de linguagens de programação, incluindo C++, Python, Ruby, HTML, Makefile e Shell, refletindo sua diversidade em projetos de desenvolvimento.
Sim, todos os repositórios da tesseract-ocr são públicos, permitindo que a comunidade acesse, utilize e contribua para suas ferramentas e modelos de OCR de código aberto.
Monitore tesseract-ocr com o RepoGuard e receba alertas no momento em que um novo repositório público aparecer.
Monitore esta conta