Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Хочу все знать (http://forum.oszone.net/forumdisplay.php?f=23)
-   -   [решено] Распознование текста (http://forum.oszone.net/showthread.php?t=33452)

nautonnier 22-10-2003 13:39 227014

Люди! Помогите, пожалуйста, далеко не молодому человеку…
Проблема с распознаванием текста на русском.
WIN XP, OFFICE XP- лицензионные, English.
Lingvo 8.0-лицензионная, Proofing Tools 2000 - скаченный, но работает, т.е. проверяет ошибки на Русском….
Office Document Imaging не распознает русский текст, т.к. в языках распознавания нет Russian.
Может быть, можно как-то добавить Русский или из Lingvo или из Proofing Tools, а может еще откуда?
Подскажите, как заставить распознавать русский в Office Document Imaging.
Заранее благодарю,
Сергей.

Vadikan 22-10-2003 19:51 227015

nautonnier
Дело в том, что Office Document Imaging не является самостоятельной разработкой Microsoft.
Цитата:

An integral part of Office Document Imaging is optical character recognition (OCR) software licensed from ScanSoft Inc (Nasdaq “SSFT”).
Иными словами, это урезаная версия Scansoft OmniPage Pro. Полная же версия поддерживает русский язык (по кр. мере так заявляет сайт производителя). Отсюда варианты:
1. Искать/Приобретать полную версию OmniPage
2. Воспользоваться Abbyy FineReader, которая является  несомненным лидером OCR на российском рынке.
Ссылки по теме:
http://www.abbyy.ru/ocr_products.asp...p;from=leftru1
http://forum.oszone.net/topic.cgi?fo...&topic=149

mleck 17-08-2006 18:18 473649

как превести tiff в word??
 
Очень надо перевести документ из tiff в Word, не используя fienereader, кто нибудь знает как??

dmitryst 17-08-2006 18:41 473660

mleck Photoshop вам поможет :). Переводим его в jpg. Можете и мне выслать, я тоже помогу.

mleck 17-08-2006 18:46 473664

А помимо Photoshop еще чем нибудь можно, машинка староя и загужать её такими программами не очень хочется, может есть програмка типа "Мастер конвертирования ABBYY PDF Transformer" ???

SilentSpider 17-08-2006 21:52 473725

mleck
Если нужно перевести картинку в текст - есть два пути - перенабрать и распознать. С русским текстом реально работает только Файнридер. Ну и CuneiForm, но его не развивают очень давно. Латинические тексты обрабатывает существенно более широкий спектр программ.

dascon 18-08-2006 03:02 473831

добавлю, что
Цитата:

Если нужно перевести картинку в текст
кроме FineReader и CuneiForm есть еще Readiris (компании I.R.I.S.) и OmniPage (компании ScanSoft). Оба знают русский, afaik.

mleck 18-08-2006 09:38 473900

Спасибо!! Всетки поставил finereader=)

clop1000 29-03-2008 19:16 770531

как оцифровать книгу
 
есть буклет на 30 страниц.
с цветными илюстрациями.
как её можно оцифровать?

хочется попробовать pdf и djvu
какки ПО надо пользоваться.

Plutonium 239 29-03-2008 19:19 770533

clop1000, например ABBYY FineReader

Erekle 01-04-2008 01:57 772063

DjVu Solo
Цитата:

В DjVu можно преобразовать графические файлы большинства популярных форматов (bmp, gif, jpeg, tiff и др.) или непосредственно получить картинку со сканера. Последнее не очень удобно, так как отсутствуют даже простые средства работы с графикой, позволяющие хотя бы обрезать черные края отсканированной картинки, повернуть ее и т.д.

Drongo 01-04-2008 12:27 772283

Объясните пожалуйста, что это за формат DjVu, и в какой программе его открывать?! У меня было несколько, но все "рвались" открыться в ACDSee, но не открывались там... пробовал в IE, объясните пожалуйста?!

Plutonium 239 01-04-2008 12:30 772286

Drongo,
http://ru.wikipedia.org/wiki/DjVu
http://soft.oszone.net/program/328/DjVuReader/

Drongo 01-04-2008 13:27 772324

Plutonium 239, Спасибо огромное за пояснения! :up

Greyman 03-04-2008 07:00 773603

Цитата:

Цитата Drongo
Объясните пожалуйста, что это за формат DjVu, и в какой программе его открывать? »

Формат *.djvu и программы?

Drongo 03-04-2008 14:37 773809

Greyman, Большое спасибо, за дополнительные объяснения. :up

magwolf 14-01-2009 11:34 1007194

Подскажите бесплатную программы для замены Fine Reader
 
Добрый день !!!
Подскажите бесплатную программы для замены Fine Reader
Или бесплатную программу для сканирование и распознавания
Заранее благодарю!

Blast 14-01-2009 11:40 1007201

Например OCR CuneiForm
Правда найти полноценную замену вряд ли удастся, уж больно богат функционал FineReader. Собственно как например найти полноценную замену Photoshop, AutoCAD, 3DMax... Другое дело, что такие монстры далеко не всеми используются на полную мощность и много функций в них присутствующих не используются повседневно.

Busla 14-01-2009 12:28 1007242

В MS Office есть OCR компонент, но не все о нём знают. По крайней мере в MS Office 2003 Document Imaging умеет распознавать.

zxzx 12-09-2010 00:57 1493415

Из изображения текста - в текст - как переделать ?
 
Здравствуите
У меня проблемма - есть документ в формате PDF - я хочу переконвертировать его в текст Word но кода я проделал над этим документом процедуру конвертации в Word(с помощью этой программы http://tfile.ru/forum/viewtopic.php?t=36743 ) - в конце конвертации программа сообщила что конвертируемый документ состоит из исключительно скриншотов книги и в текст его переделать неможет - непоможете кто знает - можно ли его как в текст(Word) переделать ?

скриншот -



спасибо

lxa85 12-09-2010 01:26 1493421

zxzx, Fine Reader бесспорно лучшая, на сегодняшний день, программа OCR распознавания текстов.

Morpheus 12-09-2010 01:27 1493422

zxzx, попробуйте http://soft.oszone.net/program/1932/...F_Transformer/

catyp 12-09-2010 13:55 1493658

Незнаю в какую тему написать,может здесь ответят.Как сделать так,что бы вместо ссылки(http://www.soccer.ru/articles/199919.shtml#5185508 )можно было написать например(здесь,тут и т.д) :wallbash:

Morpheus 12-09-2010 14:04 1493667

catyp, предупреждение! Нарушение п.3.12 ОПК.
BB-коды - url.

zxzx 15-09-2010 01:26 1495577

Цитата:

Цитата lxa85
zxzx, Fine Reader бесспорно лучшая, на сегодняшний день, программа OCR распознавания текстов. »

Благодарю.
сеичас этотт документ конвертируеться с помощью Fine Reader (за 2 суток почти пол книги) но только он что-то изображения несохраняет(непереносит в новый документ) - незнаете как сделать чтоб и изображение тоже переносил в создаваемый текст ?

lxa85 15-09-2010 08:30 1495657

zxzx, ты как-то сложно сформулировал.
Если верстка страницы сложная, есть таблицы, рисунки, и т.п., то FineReader'у необходимо помочь. Для этого в центральной панели есть инструменты позволяющие назначить тип области. Таблица, Картинка, не распознаваемая область, Текст.
Поэтому подскажи программе что да как, и я думаю у тебя все получится.

lunar 08-09-2011 10:31 1748598

Программа сканирования документов
 
Подскажите,пожалуйста, есть ли Бесплатная Простая программа для сканирования документов и затем переноса документа в электронный вид на комп с возможностью редактирования?

Morpheus 08-09-2011 10:41 1748606

Не встречалось. Да и простой программа распознавания быть не может по определению.

lunar 08-09-2011 10:45 1748609

Хорошо,тогда отбросим слово "простой" получиться только "бесплатная"

yurfed 08-09-2011 10:46 1748611

Цитата:

Цитата lunar
Бесплатная Простая программа для сканирования документов »

На вскидку - IrfanView. Это бесплатная гляделка с возможностью выбора TWAIN и сканирования.
Или вы имеете ввиду чтоб и распознавание текста имелось?
OCR CUNEIFORM понимает русский шрифт. Если не ошибаюсь она friware
Цитата:

Первоначально OCR CuneiForm разрабатывался как коммерческий продукт, однако, в декабре 2007 года компания-разработчик стала распространять программу бесплатно, а в апреле 2008 года открыла исходные тексты программы. В планах дальнейшее развитие этой системы распознавания текста – проект OpenOcr.Org, поддерживаемый компанией Cognitive Technologies и сообществом OpenSource разработчиков.
http://expscan.narod.ru/

Morpheus 08-09-2011 10:53 1748614

lunar, "бесплатная" тоже откидывайте. Никто подобный софт раздаривать не будет. Это всё достаточно большие, сложные, и не дешевые программы.

Forest Gump 08-09-2011 11:02 1748622

lunar,
попробуйте всё-таки CUNEIFORM
вполне нормально сканирует и распознает, сам успешно пользуюсь

может выдавать ошибку при работе с некоторыми сканерами. не помню точно в чем там дело. помню только, что ошибка решается простой правкой .inf файла из директории windows

Morpheus 08-09-2011 11:02 1748623

Цитата:

Цитата yurfed
OCR CUNEIFORM понимает русский шрифт. Если не ошибаюсь она friware »

О, не знал. Не встречал её с тех времён, когда она была платной. Тогда с FineReader можно было даже не сравнивать, CuneiForm - старый "запор", FineReader - новенькая иномарка.
Видимо поэтому она и стала бесплатной, что качество распознавания оставляло желать лучшего, и никому нафиг за деньги не была нужна такая программа.

lunar 08-09-2011 11:07 1748633

Откидываем всё ,теперь вопрос звучит: какая прога из платных самая незаграмождённая :только перенос уже отсканированого документа(рисунка) в электронный понятный даже обычному TXT редактору?

Forest Gump 08-09-2011 11:10 1748639

Цитата:

Цитата Morpheus
CuneiForm - старый "запор", FineReader - новенькая иномарка. »

да, если документооборот компании частенько требует использования программ для сканирования и распознавания, то без платного продукта не обойтись.

а если так, изредка, одну-две странички, то старый "запор" вполне подойдет :)

lunar 08-09-2011 11:12 1748642

Пока печатал пост не успел увидеть постForest Gump, но всё равно хотелось уж теперь узнать мнения насчёт платных прог

Morpheus 08-09-2011 11:14 1748646

lunar, а вы выбираете по "незагромождённости" или по качеству распознавания? Если всё же по качеству, то FineReader всегда был лидером.
Цитата:

Цитата Forest Gump
а если так, изредка, одну-две странички, то старый "запор" вполне подойдет :) »

Если качество распознаваемого текста нормальное, то угу. А если "так себе", то даже с одной страничкой можно насовокупляться от души :)

Forest Gump 08-09-2011 11:20 1748654

lunar,
да, выбирайте FineReader. Просто не будете использовать ненужные вам функции и всё. Зато качеством останетесь довольны


Цитата:

Цитата Morpheus
насовокупляться от души »

многие за это бешенные деньги платят, а тут - пожалуйста, бесплатно)) совокупляйся - не хочу)))

ref 08-09-2011 12:56 1748731

lunar, я пользуюсь ABBYY ScanTo Office 1.0.

lunar 08-09-2011 15:06 1748812

Цитата:

Цитата ref
ABBYY ScanTo Office 1.0. »

А чем она отличается от
Цитата:

Цитата Forest Gump
FineReader »

Если она более проста ,но качество не теряется при этом ,то подскажите по чём брали :) ?

MKN 08-09-2011 15:13 1748821

Добавлю такой вопрос в тему - а что есть приличного в мире ПО для распознавания рукописных текстов ?
FineReader никуда не годен... Теоретически его можно научить , натравливая на разноманерные буквы-символы и создавая из них "базу", но это мука адская. Недавно мучился сканируя одно письмо. Так там только у буквы "а" получилось 36 вариантов написания... Ужас.

lunar 08-09-2011 20:58 1749163

Цитата:

Цитата MKN
а что есть приличного в мире ПО для распознавания рукописных текстов ? »

А ведь действительно если платить ,то уж за такой продукт денег не жалко...

Iska 08-09-2011 22:00 1749229

MKN, я делал именно FineReader'ом (сомневаюсь, что для рукописного русского текста будет ещё что-то внятное). Научить его распознавать рукописный текст можно, но:

* почерк должен быть приличным и однородным;
* учить его надо долго и на достаточно большом объёме текста.

Всё равно работа получается жутко занудная. Так что, смысл есть, только если потребно распознать какой-то большой архив текста, написанного одним человеком

Busla 09-09-2011 09:12 1749400

Forest Gump, одну-две странички набрать быстрее. Для разового распознавания можно воспользоваться онлайн версией FineReader'а. Раньше давал пробные первые 40 или 50 страниц распознать бесплатно, как сейчас - не знаю.

MKN 09-09-2011 09:12 1749401

Цитата:

Цитата Iska
учить его надо долго и на достаточно большом объёме текста »

К сожалению именно так... И в этой связи у меня есть некоторые соображения, которые я как то уже высказывал, но не представляю как претворить в жизнь... Точнее это могли бы сделать программисты, если бы захотели...

А мысль такова : Одна и та же рукописная буква в тексте, в зависимости от почерка и др. "факторов написания", отличается от "собратьев", как правило, геметрическими вариациями - наклоном, размером и пр., которым нет числа... Собственно в этих вариациях написания и состоит мука обучения.

А что, если взять за основу для обучения, наиболее типичный для данного почерка, вариант буквы, и сделать из него базу из множества "морфинг-вариантов". Т.е. создать базу из множества геометрических разновидностей, выбранной буквы.
Десяток (или более) вариантов смещения вправо, влево, приплюснутость, вытянутость, наклон и пр. И так для всех букв данного почерка. Ессно программным способом.

А распознавание-сравнение будет происходить на основе этой созданой базы. Думаю, что точность распознавания при этом резко возрастёт, а главное сократится время рутинных операций обучения.
Цитата:

Цитата Iska
смысл есть, только если потребно распознать какой-то большой архив текста, написанного одним человеком »

Вот и у меня есть такой "смысл" в виде рукописной тетради воспоминаний одного хорошего человека.

Busla 09-09-2011 09:16 1749404

lunar, т.к. вы предполагаете редактировать документы, наверняка не обойдётся без MS Ofiice - со старшими редакциями идёт OCR. Правда, никогда сам не пользовался.

lunar 09-09-2011 15:52 1749711

Цитата:

Цитата Busla
lunar, т.к. вы предполагаете редактировать документы, наверняка не обойдётся без MS Ofiice - со старшими редакциями идёт OCR. Правда, никогда сам не пользовался.
------- »

А где среди прог MS можно найти OCR ...может в меню где-то

yurfed 09-09-2011 16:50 1749753

Цитата:

Цитата lunar
А где среди прог MS можно найти OCR »

Ставите полный пакет MS Office и будет вам счастье при помощи OneNote (пример использования)

Iska 09-09-2011 17:17 1749774

lunar, для Microsoft Office 2003 это: «\Пуск\Программы\Microsoft Office\Средства Microsoft Office\Microsoft Office Document Imaging» («%ProgramFiles%\Common Files\Microsoft Shared\MODI\11.0\mspview.exe»). Отсканировать или открыть документ, затем «\Сервис\Распознать текст…».

lunar 13-09-2011 14:16 1752044

Интересно,а как полностью удалить OCR CUNEIFORM (даже с помоощью спец проги что-то остаётся ,а что не пойму) и потом так прога была платная ,а теперь бесплатна не стану ли я случайно бета тестером?

yurfed 13-09-2011 19:07 1752249

Цитата:

Цитата lunar
даже с помоощью спец проги »

Интересно услышать её название.
Установите ещё раз и удалите с помощью Revo Uninstaller. Бесплатно. Лучше чем Your Uninstaller ( IMHO, ), который к тому же и платный.

lunar 13-09-2011 20:32 1752290

Название Tools Unistal ,остаются следы чего я сканировал и распознавал(вернее попытки :)) .. Там есть такой файлик face.ini , в нём эта инфа появляется даже после его удаления ..

ДругойПользователь 01-04-2012 21:37 1891515

Как сканировать тексты?
 
Здравствуйте.Возник вопрос перевода очень больших текстов на другой язык..Вбивать вручную трудно и долго ..Существуют ли программы которые могут прочитать на изображении текст?Имеется цифровой фотик и чернобелый сканер.

Morpheus 01-04-2012 21:50 1891530

ДругойПользователь, переношу. Читайте тему.

castanel 15-11-2014 20:54 2430002

Скажите, чем можно распознать такую бенгальщину?


Время: 00:30.

Время: 00:30.
© OSzone.net 2001-