Бесплатная программа CuneiForm для автоматического распознавания текста

2007

CuneiForm бесплатная программа для автоматического распознавания отсканированного текста. Вид у программы не «карамельный», но дело свое она знает.

Полное название — Cognitive OpenOCR, это свободно распространяемая открытая система оптического распознавания текстов российской компании Cognitive Technologies. Почему-то официальный сайт программы не отвечает. Как и сайт основанного на CuneiForm проекта OpenOCR.

Поэтому скачать ее можно, например, здесь.

Видео: распознавание текста CuneiForm

OCR CuneiForm была разработана компанией Cognitive Technologies как коммерческий продукт в 1993 году. Система поставлялась с наиболее популярными моделями сканеров, МФУ и ПО в России и мире: Corel Draw, Hewlet-Pachard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon, Olivetti и др. В 2008 году Cognitive Technologies открыла исходные коды OCR CuneiForm.

CuneiForm позиционируется как система преобразования электронных копий бумажных документов и графических файлов в редактируемый вид с возможностью сохранения структуры и гарнитуры шрифтов оригинального документа в автоматическом или полуавтоматическом режиме. Система включает в себя две программы для одиночной и пакетной обработки электронных документов. Поддерживается более 20 языков.

Кроме того, поддерживается «смесь» русского и английского языка. Распознавание смесей других языков поддерживается только в ветке, разработанной Андреем Боровским в 2009 году. Обучение другим языкам затруднительно в виду связи каждого языка с dat-файлом, структура и способ получения каковых разработчиками не раскрывались.

Дата: 08.02.2010 17:27