OCR - системы распознавания текста.

Любителям *NIX - все о любимой системе.
Ответить
Аватара пользователя
kalia
Site Admin
Сообщения: 9883
Зарегистрирован: Пт окт 09, 2009 11:52 pm
Скайп: kalia1962
Пол: Мужской
Откуда: Тбилиси
Контактная информация:

OCR - системы распознавания текста.

Сообщение kalia »

[align=justify]OCR (Optical Char Recognition - оптическое распознавание символов) в Линуксе всегда был проблемой - никаких ФайнРидеров под него нет, а существующие системы типа GOCR работают только с командной строки и только с латиницей, да и то не особо успешно...

Ветераны компьютерного фронта :)-(: наверное помнят, что первой популярной системой был не ФайнРидер, а Куниформ (Cuneiform, "клинопись" в переводе). Потом эта "клинопись" пропала с горизонта, и довольно долго про неё ничего не было слышно. И вот, кажется в прошлом году, появилось сообщение что разработчики системы Cuneiform открыли её исходные тексты и выложили в публичный доступ под открытой лицензией.

На сегодняшний день есть уже программа cuneiform в Линуксе, у которой есть простенькая графическая оболочка и которая вполне пристойно распознает тексты, причем даже на русском языке (там еще целый список языков). Я недавно ей воспользовался (кстати, распознанный текст после минимальной коррекции был опубликован здесь, на этом форуме ::yaz-yk: ). Вполне нармально работает.

Значит, еще один пробел в софте под Линукс ликвидирован, и это не может не радовать!
[/align]
Крокодил, крокожу и крокодить буду!

Аватара пользователя
razor
Вице-Адмирал
Сообщения: 1946
Зарегистрирован: Пн окт 12, 2009 9:12 pm
Откуда: Москва
Контактная информация:

Re: OCR - системы распознавания текста.

Сообщение razor »

а файлы djvu этот Куниформ распознает?
Изображение

Аватара пользователя
kalia
Site Admin
Сообщения: 9883
Зарегистрирован: Пт окт 09, 2009 11:52 pm
Скайп: kalia1962
Пол: Мужской
Откуда: Тбилиси
Контактная информация:

Re: OCR - системы распознавания текста.

Сообщение kalia »

razor писал(а):а файлы djvu этот Куниформ распознает?
png jpg jpeg tif tiff
Крокодил, крокожу и крокодить буду!

Аватара пользователя
razor
Вице-Адмирал
Сообщения: 1946
Зарегистрирован: Пн окт 12, 2009 9:12 pm
Откуда: Москва
Контактная информация:

Re: OCR - системы распознавания текста.

Сообщение razor »

в общем, djvu - не проблема...:)
Mожно надергать нужных страниц djvu в те же png jpeg tiff bmp gif при помощи WinDjView... и делай с ними что хош...:)
Изображение

Аватара пользователя
kalia
Site Admin
Сообщения: 9883
Зарегистрирован: Пт окт 09, 2009 11:52 pm
Скайп: kalia1962
Пол: Мужской
Откуда: Тбилиси
Контактная информация:

Re: OCR - системы распознавания текста.

Сообщение kalia »

razor писал(а):в общем, djvu - не проблема...:)
Mожно надергать нужных страниц djvu в те же png jpeg tiff bmp gif при помощи WinDjView... и делай с ними что хош...:)
И-мен-но! "и делай с ними что хош..." ...лап-тапа-тида-ту-дай...

[BBvideo 425,350]http://www.youtube.com/watch?v=nkVbfulgyuA[/BBvideo]
Крокодил, крокожу и крокодить буду!

Аватара пользователя
frigolem
Юнга
Сообщения: 23
Зарегистрирован: Пн окт 19, 2009 10:06 am
Откуда: Краснодар

Re: OCR - системы распознавания текста.

Сообщение frigolem »

Спасибо большое за эту инфу! Действительно, очень важная штучка, нужно будет под линухом попробовать. :-):

Ответить

Вернуться в «Самая лучшая ОС - Linux!»