Разпознавание текста

Разпознавание текста

Оптическое распознавание символов (англ. Optical Character Recognition, OCR) — механическая или электронная конвертация изображений символов и букв в текст, редактируемый на компьютере. Перевод осуществляется программным путём, после получения изображения со сканера или фото.

Текст, преобразованный из графической формы в символьную (текстовую), можно далее обрабатывать любыми текстовыми редакторами.

Программы распознавания символов

Название Лицензия Операционные системы Заметки
OnlineOCR.ru Коммерческая Online Online OCR сервис позволяет распознать многоязыковой текст из сканированного документа или фотографии. Конвертирует результат в редактируемые форматы (PDF, DOC, EXCEL, TXT, HTML)
img2txt.ru Коммерческая Online Online OCR сервис позволяет распознать многоязыковой текст из сканированного документа или фотографии. Конвертирует результат в редактируемые форматы (RTF, TXT, HTML)
ExperVision TypeReader & RTK Коммерческая Windows,Mac OS X,Unix,Linux,OS/2 Получала высокие оценки в начале 1990-х.
ABBYY FineReader Коммерческая Windows; Linux, Mac OS (не для конечного потребителя) Для работы с различными языками требуется поддержка соответствующего языка.
OmniPage Коммерческая (Nuance EULA) Windows, Mac OS Производство Nuance Communications
Readiris Коммерческая Windows, Mac OS Производство бельгийской I.R.I.S. Group. Содержит региональные пакеты для распознавания азиатских языков и языков среднего востока.
Persian Reader Коммерческая Windows Специальзируется на персидском языке (фарси).
Kirtas Technologies Arabic OCR Коммерческая Windows Может распознавать арабские и английские символы на одной странице.
Zonal OCR Коммерческая Windows Zonal OCR помогает автоматизировать извлечение данных из компьютерных изображений.
ViewWise компании Computhink Коммерческая Windows Система управления документами
Промышленная, многоязычная система, умеет сохранять форматирование текста и распознаёт запутанные таблицы произвольной структуры
GOCR GPL Кросс-платформенная В начальной стадии разработки
Microsoft Office Document Imaging Коммерческая Windows, Mac OS X
Microsoft Office OneNote 2007 Коммерческая Windows
NovoDynamics VERUS Коммерческая?  ? Специализируется на языках среднего востока
Ocrad GPL Unix-like, OS/2
Brainware Коммерческая Windows Извлечение данных из документов и их обработка; например счета, извещения, накладные и платёжки
HOCR GPL Linux Распознавание текстов на иврите
ReadSoft Коммерческая Windows Сканирование, распознавание и классификация деловых бумаг например договоров, счетов и платёжных поручений.
RelayFax Network Fax Manager
компании Alt-N Technologies
Коммерческая Windows Многоязычная система используется для преобразования факсов в доступные для правки форматы документов (doc, pdf, и т.д...).
Scantron Cognition Коммерческая Windows Для работы с различными языками требуется поддержка соответствующего языка.
SILVERCODERS OCR Server Коммерческая Linux Серверная многоязыковая система, имеет высокое качество распознавания, может сохранять форматирование текста и распознаёт запутанные таблицы произвольной структуры
SimpleOCR Freeware and commercial versions Windows
SmartScore Коммерческая Windows, Mac OS Для распознавания нотной записи
Разрабатывается компанией MIT/X Consortium Интерфейс: Браузер; Сервер: Unix Платформа для браузерных систем распознавания символов. Страница проекта: WeOCR

См. также



Wikimedia Foundation. 2010.

Игры ⚽ Нужно сделать НИР?

Полезное



Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»