OCRopus

Informations
Développé par	Thomas Breuel (d)
Dernière version	1.3.3 (16 décembre 2017)^[1]^,^[2]^,^[3]
Dépôt	github.com/tmbdev/ocropy et github.com/ocropus/ocropy.git
Écrit en	Python
Système d'exploitation	FreeBSD, Linux, macOS et Windows 10
Formats écrits	HOCR (en)
Type	Reconnaissance optique de caractères
Licence	Licence Apache
Site web	github.com/tmbdev/ocropy et github.com/ocropus/ocropy

OCRopus est un logiciel libre d'analyse de documents et de reconnaissance optique de caractères avec une conception très modulaire. OCRopus a été développé avec l'aide de Google sous la direction de Thomas Breuel du Centre de Recherche Allemand pour l'Intelligence Artificielle (DFKI) à Kaiserslautern et publié en tant que logiciel libre sous les conditions de la version 2.0 de la licence Apache.

OCRopus a été spécialement conçu pour être utilisé dans des projets de numérisation à grande échelle de livres tels que Google Livres, Internet Archive ou des projets de bibliothèques différentes, où un grand nombre de langues et de polices d'écriture doivent être prises en charge. Il peut également être employé dans des applications bureautiques, des applications pour l'usage privé, ou des applications pour les malvoyants.

Les principaux composants de l'OCRopus sont formés^[4]:

L'analyse de la structure du document
La reconnaissance optique de caractères
L'utilisation de modèles linguistiques statistiques

La reconnaissance de texte est actuellement basée sur des réseaux de neurones récurrents (LSTM) et ne nécessite pas de modèle linguistiques. Cela permet l’entraînement de modèles indépendants de la langue pour lesquels des bons résultats de reconnaissance ont été achevés à la fois pour l'anglais, l'allemand et le français^[5]. Outre l’alphabet latin, il y a des résultats pour d'autres scripts tels que Sanskrit, Ourdou ou Devanagari.

De très bons taux de reconnaissance peuvent être obtenus grâce à un entraînement approprié^[6]. Cet effort supplémentaire est particulièrement intéressant pour les documents difficiles ou les polices de caractères qui ne sont plus courants aujourd'hui (par ex. Fraktur) et qui ne sont pas au centre des préoccupations des autres logiciels d'OCR.

Liens externes[modifier | modifier le code]

page du projet à GitHub
Annonce du système OCR Open Source OCR de l'OCRopus (2007)
Reconnaissance optique de caractères avec OCRopus sur linuxfr.org

Notes et références[modifier | modifier le code]

↑ « Release 1.3.3 », 16 décembre 2017 (consulté le 15 mars 2018)
↑ « Release 1.3.3 », 16 décembre 2017 (consulté le 19 février 2020)
↑ « Release 1.3.3 », 16 décembre 2017 (consulté le 1^er août 2020)
↑ Thomas M. Breuel, « The OCRopus open source OCR system », Document Recognition and Retrieval XV, International Society for Optics and Photonics, vol. 6815,‎ 28 janvier 2008, p. 68150F (DOI 10.1117/12.783598, lire en ligne, consulté le 30 décembre 2017)
↑ Adnan Ul-Hasan et Thomas M. Breuel, « Can We Build Language-independent OCR Using LSTM Networks? », Proceedings of the 4th International Workshop on Multilingual OCR, ACM, mOCR '13,‎ 2013, p. 9:1–9:5 (ISBN 9781450321143, DOI 10.1145/2505377.2505394, lire en ligne, consulté le 30 décembre 2017)
↑ (en-US) Thomas M. Breuel, Adnan Ul-Hasan, Mayce Ali Al-Azawi et Faisal Shafait, « High-Performance OCR for Printed English and Fraktur Using LSTM Networks », 2013 12th International Conference on Document Analysis and Recognition,‎ 2013 (DOI 10.1109/icdar.2013.140, lire en ligne, consulté le 30 décembre 2017)

Portail des logiciels libres

[wikidata-60b4522465594724f680e4730bdc8cd7c0e3ecbc-1] « Release 1.3.3 », 16 décembre 2017 (consulté le 15 mars 2018)

[wikidata-8e137d1e9327486ec00cfe903af0b14bff2f0d0a-2] « Release 1.3.3 », 16 décembre 2017 (consulté le 19 février 2020)

[wikidata-a8f79991e63caac9d1bb6258c8d096f91b761497-3] « Release 1.3.3 », 16 décembre 2017 (consulté le 1^er août 2020)

[4] Thomas M. Breuel, « The OCRopus open source OCR system », Document Recognition and Retrieval XV, International Society for Optics and Photonics, vol. 6815,‎ 28 janvier 2008, p. 68150F (DOI 10.1117/12.783598, lire en ligne, consulté le 30 décembre 2017)

[5] Adnan Ul-Hasan et Thomas M. Breuel, « Can We Build Language-independent OCR Using LSTM Networks? », Proceedings of the 4th International Workshop on Multilingual OCR, ACM, mOCR '13,‎ 2013, p. 9:1–9:5 (ISBN 9781450321143, DOI 10.1145/2505377.2505394, lire en ligne, consulté le 30 décembre 2017)

[6] (en-US) Thomas M. Breuel, Adnan Ul-Hasan, Mayce Ali Al-Azawi et Faisal Shafait, « High-Performance OCR for Printed English and Fraktur Using LSTM Networks », 2013 12th International Conference on Document Analysis and Recognition,‎ 2013 (DOI 10.1109/icdar.2013.140, lire en ligne, consulté le 30 décembre 2017)

[1]

[2]

[3]

[4]

[5]

[6]