CuneiForm

CuneiForm
CuneiForm
Тип

оптическое распознавание символов

Автор

Cognitive Technologies

Разработчики

команда CuneiForm-Linux

Написана на

C, C++

Интерфейс

командная строка

Операционная система

Linux, Mac OS X и др. UNIX-подобные, Windows

Первый выпуск

1996

Последняя версия

1.1.0 (19 апреля 2011[1])

Состояние

активное

Лицензия

BSD-подобная лицензия Cognitive Technologies[2]

Сайт

launchpad.net[1]
openocr.org[3]
cognitiveforms.ru[4]

CuneiForm (англ. cuneiform кьюниформ — клинопись), Cognitive OpenOCR — свободно распространяемая открытая система оптического распознавания текстов российской компании Cognitive Technologies.

Первоначально система CuneiForm была разработана компанией Cognitive Technologies как коммерческий продукт. CuneiForm поставлялся с некоторыми моделями сканеров. Однако после нескольких лет перерыва разработки Cognitive Technologies освободила проект, прекратив его продажу и поддержку.

Содержание

Особенности

CuneiForm позиционируется как система преобразования электронных копий бумажных документов и графических файлов в редактируемый вид с возможностью сохранения структуры и гарнитуры шрифтов оригинального документа в автоматическом или полуавтоматическом режиме. Система включает в себя две программы для одиночной и пакетной обработки электронных документов.

История

В 1993 году Cognitive Technologies заключила OEM-контракт с канадской корпорацией Corel Corporation, по которому библиотека распознавания Cognitive встроена в популярный издательский пакет Corel Draw 3.0 (и последующие версии).

В 1996 году выпущена версия OCR CuneiForm '96, в которой впервые в мире применены алгоритмы адаптивного распознавания.

Адаптивное распознавание — метод, основанный на комбинации двух видов алгоритмов распознавания печатных символов: шрифтового (multifont) и шрифтонезависимого (omnifont). Система генерирует внутренний шрифт для каждого вводимого документа, основываясь на хорошо пропечатанных символах, то есть используется динамическая настройка (адаптация) на конкретные входные символы. Таким образом, метод совмещает универсальность и технологичность бесшрифтового подхода и высокую точность распознавания шрифтового, что позволяет кардинальным образом повысить качество распознавания.

В 1997 году в системе CuneiForm впервые применены технологии, основанные на нейронных сетях. Алгоритмы, использующие нейронные сети для распознавания символов, строятся следующим образом. Поступающее на распознавание изображение символа (растр) приводится к некоторому стандартному размеру (нормализуется). Значения яркости в узлах нормализованного растра используются в качестве входных параметров нейронной сети. Число выходных параметров нейронной сети равняется числу распознаваемых символов. Результатом распознавания является символ, которому соответствует наибольшее из значений выходного вектора нейронной сети.

В 1999 году разработан механизм воссоздания формы исходного документа «What you scan is what you get». Он позволяет придать документу его исходную форму, добиваясь того, чтобы каждый фрагмент находился на нужном месте. Особенно это касается документов со сложной топологией: многоколончатые тексты с заголовками, аннотациями, графическими иллюстрациями, таблицами, и т. д.

Перспективы развития

12 декабря 2007 года была выпущена freeware-версия OCR CuneiForm и анонсировано открытие её исходных текстов[5].

2 апреля 2008 года были опубликованы исходные тексты OCR Cuneiform под лицензией BSD[6], а осенью — исходные тексты интерфейса системы[7].

Последняя версия OpenSource версии для Windows не обновлялась с 14.02.2009. Эта версия больше не предлагается для скачивания.

В 2009 году выпущены графические интерфейсы к открытой версии Cuneiform на основе библиотеки Qt 4 — Cuneiform-Qt[8], YAGF. Начиная с версии 0.9.0[9] открытую версию для Linux можно использовать в качестве библиотеки.

Графические интерфейсы для CuneiForm

См. также

Примечания

  1. 1 2 Порт Cuneiform для Linux.
  2. Текст лицензии.
  3. Сайт, основанного на CuneiForm проекта OpenOCR.
  4. Домашняя страница CuneiForm на официальном сайте автора программы — компании Cognitive Technologies.
  5. OCR CuneiForm — первый промышленный Open Source проект в области распознавания
  6. Cognitive Technologies открыла код OCR Cuneiform
  7. Cognitive Technologies открыла код OCR Cuneiform
  8. Cuneiform-Qt
  9. Cuneiform Linux 0.9.0 is released

Ссылки


Wikimedia Foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Полезное


Смотреть что такое "CuneiForm" в других словарях:

  • CuneiForm — Entwickler Cognitive Technologies Aktuelle Version 0.1.0 (14. Februar 2009) Betriebssystem Windows (Linux und FreeBSD Portierungen verfügbar) Kategorie …   Deutsch Wikipedia

  • Cuneiform — redirects here. For other uses, see Cuneiform (disambiguation). Sumerian inscription in monumental archaic style, c. 26th century BC …   Wikipedia

  • cuneiform — CUNEIFÓRM, Ă, cuneiformi, e, adj. Care este în formă de cui. ♢ Scriere cuneiformă = sistem de scriere cu litere în formă de cuie săpate în piatră sau imprimate pe tăbliţe de argilă, folosit de unele popoare orientale antice. ♦ (Substantivat, f.)… …   Dicționar Român

  • Cuneiform — Cu*ne i*form (k? n? ? f?rm), Cuniform Cu ni*form (k? n? f?rm), a. [L. cuneus a wedge + form: cf. F. cunei forme. See {Coin}.] 1. Wedge shaped; as, a cuneiform bone; especially applied to the wedge shaped or arrowheaded characters of ancient… …   The Collaborative International Dictionary of English

  • Cuneiform — (lat. cuneus, Keil) kann sich beziehen auf: das Keilbein, siehe Os cuneiforme cuneiform script, engl. für Keilschrift eine Texterkennungssoftware, siehe CuneiForm …   Deutsch Wikipedia

  • cuneiform — ► ADJECTIVE 1) relating to the wedge shaped characters used in the ancient writing systems of Mesopotamia, Persia, and Ugarit. 2) chiefly Biology wedge shaped. ► NOUN ▪ cuneiform writing. ORIGIN from Latin cuneus wedge …   English terms dictionary

  • cuneiform — [kyo͞o nē′ə fôrm΄, kyo͞o′nē əfôrm΄] adj. [< L cuneus (see CUNEAL) + FORM] 1. wedge shaped 2. designating the characters in ancient Akkadian, Assyrian, Babylonian, and Persian inscriptions, or the inscriptions themselves n. cuneiform characters …   English World dictionary

  • Cuneiform — Cu*ne i*form, Cuniform Cu ni*form, n. 1. The wedge shaped characters used in ancient Persian and Assyrian inscriptions. I. Taylor (The Alphabet). [1913 Webster] 2. (Anat.) (a) One of the three tarsal bones supporting the first, second third… …   The Collaborative International Dictionary of English

  • cuneiform — (adj.) 1670s, wedge shaped, from Fr. cunéiforme (16c.), from L. cuneus a wedge, wedge shaped thing, of unknown origin, + Fr. forme (see FORM (Cf. form) (n.)). Applied to characters in ancient Middle Eastern inscriptions made with wedge shaped… …   Etymology dictionary

  • cuneiform — meaning ‘ancient wedge shaped writing’, is now normally pronounced as three syllables in BrE, i.e. kyoo ni fawm, and as four in AmE, i.e. kyoo nay i fawm …   Modern English usage


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»