Tesseract


Tesseract
Tesseract
Первый выпуск

середина 1980-х

Последняя версия

3.02 / 28 октября 2012[1]

Написана на

C++

Операционная система

Linux, Mac OS X и др. UNIX-подобные, Windows

Тип

оптическое распознавание символов

Лицензия

Apache 2.0

Сайт

code.google.com

Tesseract (англ. тессеракт) — свободная компьютерная программа для распознавания текстов, разрабатывавшаяся Hewlett-Packard с середины 1980-х по середину 1990-х, а затем 10 лет «пролежавшая на полке». В августе 2006 г. Google купил её и открыл исходные тексты под лицензией Apache 2.0[2] для продолжения разработки. В настоящий момент программа уже работает с UTF-8, поддержка языков (включая русский с версии 3.0[3][4]) осуществляется с помощью дополнительных модулей.

Содержание

История

Ядро программы Tesseract было разработано в Бристольской лаборатории Hewlett Packard и в Hewlett Packard Co, Greeley штат Колорадо в 1985—1994 годах. В 1996 были проведены значительные изменения и подготовлен порт для Windows. Затем, с 1998 года — частичная миграция с Си на Си++. Значительная часть кода изначально написана на Си, но проводились доработки для совместимости с Си++ компиляторами.[2]

В настоящее время Tesseract 3.0 собирается под Linux с GCC 2.95 и старше и под Windows с Visual C++ 2008 Express и старше (поддержка Visual C++ 6 была удалена в версии 3.0[3]). Код на C++ часто использует множество макросов для реализации контейнеров.

Графические интерфейсы для Tesseract

Для Linux
Для Windows

Зависимости

Интересные факты

Программа Tesseract используется менеджером загрузок Tucan Manager для распознавания текстов в тестах CAPTCHA.

Примечания

  1. Репозиторий Tesseract.
  2. 1 2 Vincent, Luc Announcing Tesseract OCR (August 2006). Архивировано из первоисточника 18 марта 2012. Проверено 26 июня 2008.
  3. 1 2 Tesseract 3.00 Released.
  4. Tesseract Download Page. Архивировано из первоисточника 18 марта 2012.

Ссылки



Wikimedia Foundation. 2010.

Смотреть что такое "Tesseract" в других словарях:

  • Tesseract — bezeichnet: eine Texterkennungssoftware, siehe Tesseract (Software) eine englische Band, siehe Tesseract (Band) ein niederländisches Technolabel, siehe Tesseract Records Siehe auch: Tesserakt …   Deutsch Wikipedia

  • tesseract — 1888, from TESSERA (Cf. tessera) + Gk. aktis “ray” (see ACTINO (Cf. actino )) …   Etymology dictionary

  • Tesseract — For other uses, see Tesseract (disambiguation). Tesseract 8 cell 4 cube Schlegel diagram Type Convex regular 4 polytope …   Wikipedia

  • Tesseract — Pour le logiciel de reconnaissance optique de caractères, voir Tesseract (logiciel). Tesseract Hypercube (8 cellules) Diagramme de Schlegel …   Wikipédia en Français

  • Tesséract — Hypercube Pour les articles homonymes, voir Hypercube (homonymie). Une projection d un hypercube (dans une image bi dimensionnelle) Un hypercu …   Wikipédia en Français

  • tesseract — noun Etymology: Greek tessares four + aktis ray more at actin Date: 1888 the four dimensional analogue of a cube …   New Collegiate Dictionary

  • tesseract — /tes euh rakt /, n. the generalization of a cube to four dimensions. [1885 90; < Gk tésser(es) FOUR + aktís ray] * * * …   Universalium

  • tesseract — noun a) The four dimensional analogue/analog of a cube; a four dimensional content (which see) bounded by eight cubes (in the same way as a cube is a volume bounded by six squares and a square is an area by four line segments) …   Wiktionary

  • tesseract — tes·ser·act …   English syllables

  • tesseract — /ˈtɛsərækt/ (say tesuhrakt) noun the equivalent in four spatial dimensions of a cube; hypercube. {Greek tesseres four + aktis ray} …   Australian English dictionary


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»

We are using cookies for the best presentation of our site. Continuing to use this site, you agree with this.