Список форумов |  Добавить сообщение |  Правила |  12.09.2025, пятница, 05:07:57
СПИСОК ФОРУМОВ
12.09.2025
04:43 Главная гостевая книга библиотеки(5861)
11.09.2025
09:07 Обо всем - мнения(3149)
06.09.2025
15:23 "Разыскивается песня", доска объявлений(5441)
02.09.2025
12:08 "Разыскиваются книжки", доска объявлений(15508)
10:11 Проблемы OCR и электронных библиотек(1973)
16.08.2025
07:39 Книжки, которые скоро будут выложены(56)
02.05.2025
21:25 О возвышенной поэзии(1593)
24.02.2025
13:09 Книжки, которые стоит прочитать(5230)
13:05 Водный и всякий туризм(87)
22.02.2025
06:11 Русские впечатления о заграничной жизни(9443)
05:34 Мнения читателей о дизайне библиотеки(1479)
Lib.Ru

Проблемы OCR и электронных библиотек
Тема форума: В этом форуме обсуждаются общие проблемы связанные с поддержкой электронных библиотек и сканированием книг.

А так же обсуждение статьи Вадима Ершова "О коллективных сайтах"

Отсортировано по [убыванию] [возрастанию]   

СООБЩЕНИЯ ЗА 05.09.2003
337. Zmiy, Минск (zmiy@inbox.ru) 14:18:12 [ответить]
      > 336. Илья.
      > >> 2) англ.версия не сохраняет результаты на рус.яз. (написано даже в Helpе) - это типа защита... ;)
      >
      > Вот мерзавцы. Редкостные. Головная контора в Москве и нет русского языка в программе! К черту такой файнрыдр.
      > Буду пользоваться 4-м или поиу аналоги.
     
      Ну не надо уж так... ;)
      Нормальная (нетриальная) версия будет работать как нужно!
      А тем более достойных аналогов у ФР нету! Лучше уж в ФР мучаться, чем чем-то похуже... ;)
     
      Я вот продолжил тестирование ФР7.
     
      Взял ну очень плохо отсканированный TIFF (светлый - с недостатком яркости)...
      Распознал в ФР6 и ФР7 и не заметил, чтобы качество распознавания было другим! И там и там одинаковые ошибки! Где в ФР6 не распознавало, там же и ФР7 не распознает...
      Конечно, как я уже говорил ниже :), за счет того что некоторые "неуверенности" теперь не показываются, то да - качество получше... Но по-моему это чисто надуманное улучшение качества. Раньше, к примеру, все без исключения "неуверенности" показывались, а теперь достаточно во внутреннем словаре ФР найти неуверенное слово и сделать вывод, что неуверенности нет - слово же "человеческое" распозналось;). Не говоря уж о том, что в ФР5/6 "неуверенными" были даже пробелы!
      Поэтому те, кто после распознавания сразу сохранял текст и вычитывал в других редакторах, - для тех ничего не улучшится!
      Те же, кто после распознавания, проверял текст в самом ФР, тому конечно улучшение будет заметно! Скорость такой проверки будет повыше...
     
      Забавно другое - в каждой новой версии разработчики уверяют нас, что качество улучшилось на ...дцать процентов... Это если сложить все эти проценты получиться ж ох какая сумма - процентов 100 относительно, например, ФР4. ;) Но такого уж глобального улучшения, по крайней мере, я Н Е В И Ж У !!!
      Какие же это "внутренние тесты компании" проходит ФР, если в реальной работе больших улучшений не заметно...
     
      P.S. Я тут, конечно, не рассматриваю новинки в ФР6/7 типа распознавания PDF... Я тестировал только те функции, которые применяются при сканировании книг!


СООБЩЕНИЯ ЗА 07.09.2003
338. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 01:25:30 [ответить]
      Кста, а как быстро она пдф обрабатывает? (прошу указать притом частоту процессора и размер оперативки). Приблизительно, конечно.


СООБЩЕНИЯ ЗА 08.09.2003
339. Bowline, Москва (bowline@mail.ru) 07:32:03 [ответить]
      А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...


340. Zmiy, Минск (zmiy@inbox.ru) 10:09:39 [ответить]
      > 339. Bowline.
      > А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...
     
      www . abbyyusa . com в downloadax... Но это бесполезный trial (не качай зазря)...


СООБЩЕНИЯ ЗА 09.09.2003
341. п я я я п╟я , п я я п╟п╫п╟ (nurshat@ok.kz) 14:20:48 [ответить]
      п я п╬я я п©п╬п╪п╬я я .
      п я п╬ п╪п╬п╤п╣я п©п╬п╢я п╨п╟п╥п╟я я пЁп╢п╣ п╪п╬п╤п╫п╬ п╫п╟п╧я пё пЁя п╟я пёя п╣я п╨пёп╧ пёп╫я п╣я я п╣п╧я п╢п╩я п п╢п╪пёп╫пёя я я пёя п╬п╡п╟п╫пёпё Informix-я п╟, пё п╨п╟п╨ п╪п╬п╤п╫п╬ п╣пЁп╬ я я я п╟п╫п╬п╡пёя я . п п╬п╤п╣я я п╟п╧я п©п╬п╢я п╨п╟п╤п╣я п╣. п п╩я я я пёп╣ я я п╩п╨пё пЁп╢п╣ п╪п╬п╤п╫п╬ п╠я п╢п╣я п©п╬я пёя п╟я я .
     
      п п╟я п╟п╫п╣п╣ п╠п╩п╟пЁп╬п╢п╟я п╣п╫


342. textshare, 15:33:10 [ответить]
      В пятницу купил лицензионный FineReader 7 Professional.
      У меня грустное впечатление: функциональных изменений я не усмотрел, только перешли от установки с ключевой дискетой на активизацию по сети или телефону с привязкой к железу компа.
     
      Ставишь программу, она выдает номер, который должен зависить от твоего железа. (В руководстве написано, что "небольшой" апгрейд его не изменит, а для нового компа нужна новая активация) Мне по телефону код активации выдали мгновенно. Причем с перерывом в час я FR поставил и на свой ноутбук, и без вопросов получил второй код активации (!). Интересно бы попробовать и в третий раз :-)
     
      Есть предварительное впечатление, что Змей прав, и они снизили уровень проверки и пометки неуверенно распознанных слов и знаков.
      FR, кажется, стал опасно самостоятелен в выборе вариантов: я 3-4 раза ловил его на том, что он при распознании заменил слово и даже его не пометил, как неуверенно распознанное.
     
      Устранен один маленький но неудобный баг (а может и не баг, а так,неосмотр) - изменение инструмента работы с изображением при переходе от страницы к странице. Например, если я прохожусь по всему пакету и чищу изображения от грязи, виньеток или колонтитулов, то каждый раз после переходп к изображению новой страницы приходилось заново выбирать ластик.
     
      Конец короткого абзаца по-прежнему в 20% случаев не определяется и переход к новой строки в конец не вставляется. Были еще какие-то впечатления, но всего не упомню, если интересно - спрашивайте.
     
      Общее впечатление: FR 7 - чисто маркетинговый ход, чтобы еще раз получить деньги с больших корпоративных клиентов за активацию в привязке к железу.


343. Den, 19:54:42 [ответить]
      > 340. Zmiy.
      > > 339. Bowline.
      > > А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...
      >
      > www . abbyyusa . com в downloadax... Но это бесполезный trial (не качай зазря)...
     
      А кряк под этот триал найти невозможно? Через тот же гугль?


СООБЩЕНИЯ ЗА 12.09.2003
344. Григорий, Ярославль 15:17:20 [ответить]
      Касательно файнридера. Если речь идет о книгах, с их сложным языков и различными авторскими придумками, распознавать стоит не 6 и 7-м, а 5-м ФР. Он меньше придумывает. Совершенно согласен с textshare, в том, что трудней именно эти придумки отлавливать, которые ворд не считает за ошибки.


СООБЩЕНИЯ ЗА 13.09.2003
345. bmn, (bmn@lib.ru) 10:32:46 [ответить]
      > и 7-м, а 5-м ФР. Он меньше придумывает. Совершенно согласен с
      Не согласен. 5-й тоже придумывает преизрядно.


346. Bowline, Москва (bowline@mail.ru) 11:40:02 [ответить]
      > 343. Den.
      > > 340. Zmiy.
      > > > 339. Bowline.
      > > > А кто-нибудь не знает, где Файн ридер этот взять? А то я что-то не найду...
      > >
      > > www . abbyyusa . com в downloadax... Но это бесполезный trial (не качай зазря)...
      >
      > А кряк под этот триал найти невозможно? Через тот же гугль?
     
      А может есть где не-трайал?


СООБЩЕНИЯ ЗА 14.09.2003
347. Артман, Волгоград (artman@mail.ru) 01:24:54 [ответить]
      Меня 5-й очень редко подводил, триал есть с каждым сканером, а если нужен кряк, то пишите - вышлю.


348. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 02:16:03 [ответить]
      Есть в сети книги типа ван Спэнкерен, история американской литературы (http://www.russian.rpo.at/pdf/ch1_lit.pdf>http://www.russian.rpo.at/pdf/ch1_lit.pdf), сделанные в pdf. В txt они корректно не конвертятся. Конвертация сама по себе достаточно простая, по принципу: латинская а соответствует русской ф, s - ы и т.д. Проблема в том, что после такой конвертации остается штук 5 русских букв, не имеющих соответствий в латинском наборе. Они обозначаются точками, и остается догадываться, какие это буквы на самом деле. Есть идеи для решения такой закавыки?


СООБЩЕНИЯ ЗА 18.09.2003
349. зТЙЗПТЙК, сТПУМБЧМШ 13:04:27 [ответить]
      > 345. bmn.
      > > и 7-м, а 5-м ФР. Он меньше придумывает. Совершенно согласен с
      > Не согласен. 5-й тоже придумывает преизрядно.
      Там это можно частично отключить, в большей степени, чем в шестом.


СООБЩЕНИЯ ЗА 19.09.2003
350. Один из..., 13:19:42 [ответить]
      Защита FR7 вскрыта...


351. V.Yesaulov, Moskva (yes@zonus.ru) 13:32:38 [ответить]
      > 350. Один из....
      > Защита FR7 вскрыта...
     
      Плачет по вам ФБР. Горькими слезами! :)


СООБЩЕНИЯ ЗА 21.09.2003
352. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 03:08:53 [ответить]
      > 351. V.Yesaulov.
      > > 350. Один из....
      > > Защита FR7 вскрыта...
      >
      > Плачет по вам ФБР. Горькими слезами! :)
     
      Фиг с ней, с фыбырой, она за бугром и до нее нам никаких дел нету. Действительные проблемы я вижу в другом. Их две. Первая. Из-за того, что программы и приложения платные, для общества в целом больше убытков, чем прибыли. Вторая. Хороший кряк ФР, в частности, - очень даже большая редкость. А сам по себе кряк как таковой - дело совершенно обычные, которое у сотен тысяч наших соотечественников никаких эмоций и вопросов вообще не вызывает. Поскольку сообщение о том, что крякнут 7-й ФР, я вопринимаю как пустой звук.


СООБЩЕНИЯ ЗА 24.09.2003
353. Zmiy, Минск (zmiy@inbox.ru) 16:18:06 [ответить]
      И опять о наших бар-ранах (о ФР7):
     
      Может этот ФР7 и распознает лучше на каких-то "внутренних тестах ABBYY" или стал лучше в каких-то применениях на PDFах, но все-таки он хуже ФР5 по сохранению оформления.
      Замечено следующее: если в ФР5 при сохранении в Word обычно используется выравнивание по ширине, то в ФР6/7 разработчики почему-то намудрили (наверное от слова "мудаки") и в тех же местах идет выравнивание влево, что я считаю вообще нонсенсом в DOC. Особенно это заметно на диалогах. Так еще ж в ФР6/7 появилось заполнение пробелами именно из-за того, что нужно же как-то растянуть строку, раз уж выравнивание влево... Два пробела подряд в файлах DOC - это тоже маразм!
      Если в ФР5 на тех местах, где шла склейка абзацев, идет выравнивание влево, то такие склейки легко находятся полуавтоматически, например, в Wordе. То на ФР6/7 эти же склейки не отличишь от нормальных ситуаций...
      У меня написана программа, которая из сохраненного в ФР специальным образом RTF файла, путем анализа этих самых выравниваний, делает текстовый файл с исправлениями склееных/разделенных абзацев. Так вот на ФР5 программа делает потрясающие результаты - в большинстве случаев после нее нет дополнительной правки абзацев. В то время как после ФР6/7 из-за таких заумностей, как выравнивание влево в нормальных абзацах, - делается много доисправлений...
     
      ...и я вернулся на ФР5.
     
      P.S. условный (для V.Yesaulovа): Если какая-то программа некорректно выполняет заявленные функции, то будете ли Вы покупать такую программу?


СООБЩЕНИЯ ЗА 26.09.2003
354. Zmiy, Минск (zmiy@inbox.ru) 01:36:14 [ответить]
      Всем! Всем! Всем!
     
      Вот же блин невнимательность!
      Показали мне в ФР7 возможность сохранения текста как было в ФР4 - с форматированием пробелами...
      Опции-Распознование-Тип страницы-Форматированный пробелами текст, но нужно ставить эту опцию перед распознованием... Так, что интересно - эта опция есть и в ФР5 и в ФР6... А я Вам тут мозги пудрю, а Вы не можете указать на решение... --------------;-)
      При таком варианте нет проблем с абзацами, которые остались при сохранении в вордовские форматы... Так что учтите, что если Вы делаете текст только в Ворде и не исправите ошибок выравнивания после ФР5/6/7, то при сохранении Вашего вордовского файла в TXT будет склейка/разделение абзацев!!!
     
      P.S. Ушел писать прогу преобразования сохраненного из ФР текста форматированного пробелами в правильный(!) текст, готовый к вставке в Ворд...


355. Zmiy, Минск (zmiy@inbox.ru) 12:19:59 [ответить]
     
      Вопрос на засыпку :
     
      Как в ФР найти символ "конец абзаца"???
      (не путайте с символом разрыв строки!)


356. Sokolov, N.Novgorod (sokolov_av@pochtamt.ru) 20:52:13 [ответить]
      > 355. Zmiy.
     
      > Вопрос на засыпку :
      >
      > Как в ФР найти символ "конец абзаца"???
      > (не путайте с символом разрыв строки!)
      А что - в 7-ом уже есть подержка подобных замен? Или имеется в виду копание в самих frf-файлах?


357. Moris, Moscow 23:57:28 [ответить]
      Простите, но вроде как у вас не работает поисковик =( а без него я ваабще ничего найти не могу =(


СООБЩЕНИЯ ЗА 27.09.2003
358. Zmiy, Минск (zmiy@inbox.ru) 00:19:03 [ответить]
      > 356. Sokolov.
      > > 355. Zmiy.
      >
      > > Вопрос на засыпку :
      > >
      > > Как в ФР найти символ "конец абзаца"???
      > > (не путайте с символом разрыв строки!)
      > А что - в 7-ом уже есть подержка подобных замен? Или имеется в виду копание в самих frf-файлах?
     
      поиск работает в фр5-6-7, но только для "мягкого переноса" и "разрыва строки"...
      а я ищу как можно найти "конец абзаца"...
      никто не знает?
     
      frf не поизменяешь - в фр5-6-7 после таких изменений не открывается страница... видно там какие-то контрольные суммы...


359. Sokolov, N.Novgorod (sokolov_av@pochta.ru) 11:11:38 [ответить]
      > 358. Zmiy.
      > > 356. Sokolov.
      > > > 355. Zmiy.
      > поиск работает в фр5-6-7, но только для "мягкого переноса" и "разрыва строки"...
      > а я ищу как можно найти "конец абзаца"...
      > никто не знает?
      >
      > frf не поизменяешь - в фр5-6-7 после таких изменений не открывается страница... видно там какие-то контрольные суммы...
     
      Насчет контрольных сумм не уверен. Дело в том, что каждый фрейм (абзац) пишется в отдельный блок -- сначала следует текст (в FR5-7 в Unicode, по-моему), за ним -- описание форматирования, привязка и т.д. При копании нарушается, наверное, привязка к изображению. А вот насчет поиска конца абзаца -- при сохранении форматировании пробелами весь текст в файле пишется в один фрейм (по крайней мере, в 4-ом).


СООБЩЕНИЯ ЗА 28.09.2003
360. kvik, Архангельск (vickers@atnet.ru) 13:45:09 [ответить]
      > 17. Григорий.
      > > 15. Zmiy.
      > > Вопрос ко всем :
      > > Q: У кого какой сканер, его цена и скорость сканирования в час для разворота книжки обычного(самого распространенного) формата?
      >
      > Сейчас основные сканеры:
      > Mustek 12000 SP Plus (SCSI) скорость сканирования А4 (300дпи) примерно 30 сек. С учетом обратного хода - чуть больше разворота в минуту. Тк. медленный обратный ход. Зато недорого.
      > Acer 640S (SCSI) - проход - чуть быстрее, откат быстрый. Гасит лампу.
      >
      > Замечательны (из опробованных планшетников) старые Хьюлеты - 4c например. 15-20 сек сканирование 10 - обратный ход. Гасит лампу при обратном ходе - тоже плюс. Только не достать их теперь.
      >
      > Совершенно глупо использовать дорогие с высокой цветопередачей сканеры. Они перед каждый проходом греют и калибруют лампу.
      > Вывод - чем дешевле (проще) - тем лучше.
      > SCSI - быстрее чем USB. Правда, такой вывод только на основании личного опыта.
      >
      > > У меня Mustek 1200CU (USB). Цена до 70$. Скорость 200 стр. в час (100 разворотов).
      >
      > Быстро. Меняю представление о ЮСБ.
      >
      > > Я сканю и распознаю сразу, чтоб видеть ошибки распознавания и соответствующе корректировать яркость...
      >
      > Корректирую яркость только в начале сканирования и меняю только в случае, если вижу, что качество печати меняется. Распознаю пакетно. По ночам. Правда после выделения блоков - просматриваю. Особенно если стихи. Бывает такое запилит...
      >
      > > Как понимать Thick-as-a-brick "страницы плохо раскрываются"??? Уточни...
      > > Как понимать Thick-as-a-brick "И времени нет"??? --------------;-) Компьютер-то и так занят... (если он один...)


361. kvik, Архангельск (vickers@atnet.ru) 13:46:53 [ответить]
      Помогите найти драйвера для mustek 12000sp plus (scsi) под 98 windows


СООБЩЕНИЯ ЗА 29.09.2003
362. Zmiy, Минск (zmiy@inbox.ru) 10:27:25 [ответить]
      > 361. kvik.
      > Помогите найти драйвера для mustek 12000sp plus (scsi) под 98 windows
     
      Вот тут что-то есть, но больно старое :
      http://www.mustek.com.tw/Download/driv_scanr/europe/12000spplus.html>http://www.mustek.com.tw/Download/driv_scanr/europe/12000spplus.html
     
      Тогда попробуй это :
      http://deck.net.ru/drivers/scanner/Mustek/ScanExpress>http://deck.net.ru/drivers/scanner/Mustek/ScanExpress%2012000SP/
     
      Если нет, то пробуй тут : (только нужно иметь сер.номер сканера)
      http://www.mustek.de/eng_/html/treiber/scanner_scanexpress_scsi.htm>http://www.mustek.de/eng_/html/treiber/scanner_scanexpress_scsi.htm
     
      Или тут, но по-русски : (тоже нужно иметь сер.номер сканера)
      http://www.mustek.ru/products/12000sep.htm>http://www.mustek.ru/products/12000sep.htm
     
      Если нет, тогда пробуй подобрать работающий драйвер на похожий сканер (например, Mustek ScanExpress 1200 III SP) тут :
      http://www.nix.ru/drivers/scanner_mustek.html>http://www.nix.ru/drivers/scanner_mustek.html


СООБЩЕНИЯ ЗА 02.10.2003
364. В.Воблин, 14:31:08 [ответить]
      Господа, кто уже поработал с седьмой версией ФайнРидера: ваше мнение? Какие на самом деле улучшения вы заметили? (если вообще).
     
      И очень интересно, есть ли разноца между сканерами по скорости прохода одной страницы при прочих равных улоовиях, замерял ли кто-нибудь этот параметр и что получилось. Я пытался говорить на эту тему с продавцами спец.магазина и ничего от них не услышал толкового на эту тему.


365. леа, ариель (alkraftmakher@hotmail.com) 18:59:14 [ответить]
      Обратите внимание, что некоторые книги невозможно скачать, например, В.Набоков повесть "Другие берега" и несколько книг Рекса Стаута, начиная с "Убийство по правилам". Может быть найдете время исправить это досадное недоразумение, потому как возможности читать online в интернете у меня нет, возможно и у других читателей тоже. И, кстати, очень неудобно скачивать книги из вашей библиотеки, нужно ждать, пока раскроется файл, потом отправлять его в gzip, куда удобнее скачивать книги в OCR Aldebaran, а выбор там не такой большой как у вас. Пожалуйста, подумайте над тем, как можно было бы читателям с минимальными затратами времени скачивать книги. Всего доброго


СООБЩЕНИЯ ЗА 03.10.2003
366. Zmiy, Минск (zmiy@inbox.ru) 00:29:19 [ответить]
      Уф...
     
      CLTXT - ЧИСТКА И СКЛЕЙКА ТЕКСТА ПОСЛЕ FINEREADERА (ВЕР. 2.00)
     
      ОПИСАНИЕ
     
      Программа предназначена для автоматической чистки и склейки текста, форматированного пробелами и неубранными переносами слов, либо текста после распознования книги в FineReaderе.
      Выходной файл с расширением OUT представляет собой текст в кодировке DOS(ALT), в котором каждая строка - это абзац.
     
     
      ВЫПОЛНЯЕМЫЕ ФУНКЦИИ
     
      - распознование кодировок WIN и DOS(ALT);
      - преобразование в кодовую страницу DOS(ALT);
      - удаление форматирования пробелами;
      - склейка строк в один абзац (абзац = одна строка);
      - склейка страниц;
      - удаление мусора и номеров страниц;
      - коррекция слов с переносами (по русскому словарю MS Word; по текущему тексту; по запросу у пользователя);
      - выделение подстраничных сносок по символу '*' ;
      - коррекция пробелов и знаков препинания;
      - выделение глав, подглав и т.д. переводом строки.
     
     
      Скачать программу можно здесь: http://zmiy.da.ru>http://zmiy.da.ru
      Качаем, пробуем, критикуем...


367. Эмин, Баку (azeribooks@narod.ru) 09:22:25 [ответить]
      > 366. Zmiy.
      > Уф...
      >
      > CLTXT - ЧИСТКА И СКЛЕЙКА ТЕКСТА ПОСЛЕ FINEREADERА (ВЕР. 2.00)
     
      Zmiy, при исполнении программы Виндоуз выдает ошибку "cltxt.exe - обнаружена ошибка. Приложение будет закрыто. Приносим извинения за неудобства.Передайте Microsoft сведения об ошибке. Отправить отчет, НЕ ПЕРЕДАВАТЬ" Система у меня ХР. Что делать?


368. Эмин, Баку (azeribooks@narod.ru) 13:13:03 [ответить]
      После обработки текста FR6.0 и затем aftescan-ом переносы никогда не соединяются. Приходтся все вручную обрабатывать.
      Например в тексте было вот так: "исполь-зовать", после обработки получается "исполь зовать". Может кто знает, как сделать так, чтобы автоматически все слова с переносами соединялись, т.е в конечном счете выглядело бы так: "использовать"?


369. Zmiy, Минск (zmiy@inbox.ru) 13:55:06 [ответить]
      > 367. Эмин.
      > > 366. Zmiy.
      > > Уф...
      > >
      > > CLTXT - ЧИСТКА И СКЛЕЙКА ТЕКСТА ПОСЛЕ FINEREADERА (ВЕР. 2.00)
      >
      > Zmiy, при исполнении программы Виндоуз выдает ошибку "cltxt.exe - обнаружена ошибка. Приложение будет закрыто. Приносим извинения за неудобства.Передайте Microsoft сведения об ошибке. Отправить отчет, НЕ ПЕРЕДАВАТЬ" Система у меня ХР. Что делать?
     
      А readme.txt прочитал? См. раздел "Системные требования"...
      С Office XP (Word XP) программа не будет работать! При проверке слов на дефис/перенос используется вызов спелчекера Wordа. Но работает это только с Word 97/2000, т.к. MS поменяли в Word XP функцию вызова спеллчекера... Я ищу выход из этой ситуации...


370. Zmiy, Минск (zmiy@inbox.ru) 14:01:08 [ответить]
      > 368. Эмин.
      > После обработки текста FR6.0 и затем aftescan-ом переносы никогда не соединяются. Приходтся все вручную обрабатывать.
      > Например в тексте было вот так: "исполь-зовать", после обработки получается "исполь зовать". Может кто знает, как сделать так, чтобы автоматически все слова с переносами соединялись, т.е в конечном счете выглядело бы так: "использовать"?
     
      А кто сказал что должно быть "использовать"??? Вдруг в книге герой заикается и там так и написано - "исполь-зовать"? Так нельзя автоматически править!
      После правки текста AfterScan выводит результаты, чего он там направил, в таблицу. Не поленись и пройди по строчкам - проверь, что он направил... Это не так уж и долго...


СООБЩЕНИЯ ЗА 05.10.2003
371. Lexa, (lexahr@inbox.ru) 13:42:40 [ответить]
      > 342. textshare.
      > В пятницу купил лицензионный FineReader 7 Professional.
      > Есть предварительное впечатление, что Змей прав, и они снизили уровень проверки и пометки неуверенно распознанных слов и знаков.
      > FR, кажется, стал опасно самостоятелен в выборе вариантов: я 3-4 раза ловил его на том, что он при распознании заменил слово и даже его не пометил, как неуверенно распознанное.
      >
     
      Есть такое. Ещё он почему-то иногда не распознаёт явные переносы, т.е. переносы в словах, которые точно есть в словаре.
     
      > Устранен один маленький но неудобный баг (а может и не баг, а так,неосмотр) - изменение инструмента работы с изображением при переходе от страницы к странице. Например, если я прохожусь по всему пакету и чищу изображения от грязи, виньеток или колонтитулов, то каждый раз после переходп к изображению новой страницы приходилось заново выбирать ластик.
     
      Это было ещё в FR6. Причём, насколько я помню, в триал-версии этой возможности не было. (Или может эта возможность добавилась после установки SP2?)


372. Lexa, (lexahr@inbox.ru) 13:49:18 [ответить]
      > 364. В.Воблин.
      > Господа, кто уже поработал с седьмой версией ФайнРидера: ваше мнение? Какие на самом деле улучшения вы заметили? (если вообще).
     
      Единственное улучшение, которое я заметил - стал иногда включать одиночную цифру (например, в названии главы) в текстовый блок.
     
      > И очень интересно, есть ли разноца между сканерами по скорости прохода одной страницы при прочих равных улоовиях, замерял ли кто-нибудь этот параметр и что получилось. Я пытался говорить на эту тему с продавцами спец.магазина и ничего от них не услышал толкового на эту тему.
     
      Есть. На моём текущем (UMAX Astra 4500) и предыдущем (Acer ScanPrisa640U) цифры соответственно таковы (для ч/б или grayscale, 300dpi, размер сканируемой области 185мм/240мм): 250 разворотов в час и 110 разворотов в час.


373. Andrej, Ekaterinburg (tverjakov@mail.ru) 14:39:42 [ответить]
     
      Кстати, о скорости сканирования.
     
      На моем Mustek BearPow 1200 при использовании встроенного в Файнридер TWAIN-драйвера скорость сканирования одного разворота у ФР6 примерно в 1,5 раза больше, чем у ФР5 (примерно 22 и 35 секунд соответственно) - и скорость проходки больше, и, главное, меньше пауза между страницами.
     
      Подскажите, плиз, как с этим у ФР7, увеличилась ли скорость?


СООБЩЕНИЯ ЗА 07.10.2003
374. Леонид, Киев (mos777@ukr.net) 05:33:37 [ответить]
      Самый лучший сканер для сканирования книг, на мой взгляд, Fujitsu ScanSnap.
      Двухсторонний до 15 стр/мин., автоподатчик 50 листов, USB, 300 dpi, цветной, обратите внимание:
      поддержка форматов Минимум: A8 Максимум: A3. СКАНЕР СРАЗУ СКАНИРУЕТ ВPDF ФАЙЛ. Цена в Киеве 658$. Минус - нужно потрошить книги. Подробнее: http://www.pirit.com.ua/scanners/fujitsu/scansnap.htm>http://www.pirit.com.ua/scanners/fujitsu/scansnap.htm
      Кстати, если кто купит подобное очень, прошу написать отзыв mos777@ukr.net
      Для вычитки лучше программы Rutaplaj пока не встречал. Rutaplaj - программа перевода и
      проверки орфографии, интегрированная в WORD. Разработчик Украина, но русскоязычный текст проверяет вплоть до запятых. Может, кто осилит в итоге специальную программу-плагин, которая сможет автоматически, сканировать, распознавать,
      передавать в Word, проверять орфографию, сохранять в TXT или WORD-файл. Думаю, для грамотного программиста работа по плечу. Почему нужен txt, а не PDF? Лично я в последнее время книги не
      читаю, а слушаю с помощью программы синтезатора речи "НИКОЛАЙ". На сегодняшний день с модулями-словарями качество неплохое. По крайней мере, иногда забываюсь, что читает компьютер.
      Никакого там электронного голоса типа "Я РОБОТ". Конечно, ребенку не поставишь - ударения зачастую неправильные. Идеальным вариантом, было бы сохранять два формата, если присутствуют иллюстрации, txt и PDF. Я сканированием книг пока не занимался, но хочу начать. По этой причине прошу НАПИСАТЬ МНЕ ЛЮДЕЙ ИЗ КИЕВА И УКРАИНЫ, занимающиеся сканированием книг,
      для координации действий и обмена редкими электронными книгами в первую очередь интересуют о теме: Экономика, финансы, история, политика, психология, право,маркетинг,
      учебники ... Мои координаты mos777@ukr.net , Киев-222, а/я 226, тел.: (044) 547-24-07д Леонид


375. PDF-Library, Augsburg, Germany (info@imwerden.de) 13:27:36 [ответить]
      Сейчас ехал на работу и слушал по радио (немецкому) : открывается Франкфуртская международная книжная ярмарка. Главная страна в этом году: Россия. И далее интервью с русскими школьниками: Что вы читаете ? Ответ: Пушкина, Шиллера, Достоевского.
      Немецкие комментаторы ошеломлены: никто не назвал Стивена Кинга etc.


376. InFAiR, Уфа (infair@rusoil.net) 17:20:44 [ответить]
      Привет всем OCR-щикам и спецалистам по txt.
      Вопрос: никто из Вас не встречал программ
      лингвистического анализа текстов
      (количество слов, % ошибок,
      подсчет слов, синонимов
      составление словарей и т.п).
      Нужна программа,
      способная работать с 4-5 тыс. файлов
      общим объемом 5-6 GB в txt/dos
      Спасибо.


СООБЩЕНИЯ ЗА 09.10.2003
377. Zmiy, Минск (zmiy@inbox.ru) 00:04:02 [ответить]
      > 367. Эмин.
      > > 366. Zmiy.
      > > Уф...
      > >
      > > CLTXT - ЧИСТКА И СКЛЕЙКА ТЕКСТА ПОСЛЕ FINEREADERА (ВЕР. 2.00)
      >
      > Zmiy, при исполнении программы Виндоуз выдает ошибку "cltxt.exe - обнаружена ошибка. Приложение будет закрыто. Приносим извинения за неудобства.Передайте Microsoft сведения об ошибке. Отправить отчет, НЕ ПЕРЕДАВАТЬ" Система у меня ХР. Что делать?
     
      Эмин, скачай Crypt Edit Spell Checker:
     
      http://zpdd.chat.ru/files/spellset.exe>http://zpdd.chat.ru/files/spellset.exe (1160605)
     
      установи его и все будет работать и в XP...


378. Mikolaj, Bydgoszcz 00:51:04 [ответить]
      Czesc!!
      Ucze sie rosyjskiego, ale nie wiem za bardzo o co chodzi!


СООБЩЕНИЯ ЗА 10.10.2003
379. V.Voblin, 03:16:18 [ответить]
      > 372. Lexa.
      > > 364. В.Воблин.
      > > с седьмой версией ФайнРидера: ваше мнение?...
      > Единственное улучшение, которое я заметил - стал иногда включать одиночную цифру (например, в названии главы) в текстовый блок.
      >
      > > ...есть ли разница между сканерами по скорости прохода одной страницы...
      >
      > Есть. На моём текущем (UMAX Astra 4500) и предыдущем (Acer ScanPrisa640U) цифры соответственно таковы ...: 250 разворотов в час и 110 разворотов в час.
     
      Lexa, сердечное спасибо за обстоятельный ответ.
      Интересно, какой интерфейс был у обоих ушпомянутых сканеров. USB?
     
      Всем спасибо за обсуждение Файнридера-7. Печально. Я бы им накидал рацпредложений, частично и с готовыми решениями на уровне псевдокода. И, уверен, у многих OCR-щиков накопилось :)


380. Maks, (plforms@yandex.ru) 11:37:32 [ответить]
      Кто интересуется более читабельным форматом текста, смотрите
      этот сайт http://plforms.narod.ru>http://plforms.narod.ru


381. slava, москва (slavaaa@yandex.ru) 14:52:50 [ответить]
      Приветствую всех участников форума.


382. slava, москва (slavaaa@yandex.ru) 15:03:21 [ответить]
      хотелось бы обсудить некий набор минимальных или максимальных требований к эл. книгам в сети.
      С целью некой стандартизации.
      За многие годы сканирования у меня сложился свой подход к этому вопросу.
      Мои книги можно посмотреть у меня на сайте.
      В моем варианте есть недостатки, но главное для меня - это максимальное приближение к бумажному варианту.


СООБЩЕНИЯ ЗА 11.10.2003
383. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 01:21:53 [ответить]
      > 376. InFAiR.
      > Привет всем OCR-щикам и спецалистам по txt.
      > Вопрос: никто из Вас не встречал программ
      > лингвистического анализа текстов
      > (количество слов, % ошибок,
      > подсчет слов, синонимов
      > составление словарей и т.п).
      > Нужна программа,
      > способная работать с 4-5 тыс. файлов
      > общим объемом 5-6 GB в txt/dos
      > Спасибо.
     
      Соответствующие модульки, как общеизвестно, имеются в штатном наборе паскакаля и сей. Считают авторские листы. А по заложенному в них алгоритму желаемое сделать проще пареного. Смышленые восьмикласники делают с этими иодулями чудеса. Но если чайникам вроде Вас подобные большущие секреты выдавать, то программеры будут в голодных корчах мучиться, что не будет правильно и гуманно. Каюсь перед программерами посему.


384. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 01:34:38 [ответить]
      > 382. slava.
      > хотелось бы обсудить некий набор минимальных или максимальных требований к эл. книгам в сети.
      > С целью некой стандартизации.
      > За многие годы сканирования у меня сложился свой подход к этому вопросу.
      > Мои книги можно посмотреть у меня на сайте.
      > В моем варианте есть недостатки, но главное для меня - это максимальное приближение к бумажному варианту.
      Прекрасно. Изложите Ваши соображения для всех в обобщенном виде, тогда будет что обсуждать. Чувствую, внимательно следя за Вашими работами, что я Ваш единомышленник, но если слово изреченное есть ложь, то неизреченное слово содержит нуль информации.


СООБЩЕНИЯ ЗА 12.10.2003
385. Константин, Екатеринбург 16:22:40 [ответить]
      Кхе-кхе...Я вообщето понимаю что не по адресу но всетаки...жил у меня сидюк Creative, гудел как пылесос "Урал", и поколол на днях диск - самоучитель по англискому "Tell Me More" диск староват, ноеще вполне хорош. Вобщем дайте урлю где можно будет купить подобный софт, а то по ссылкам кликать замаешся, заранее благодарен.


386. Ихтик, Уфа (iht57@mail.ru) 18:24:08 [ответить]
      Где-то с неделю парился не мог крякнуть FR 7.0. Наконец-то всё нормально работает теперь.
      Прямой линк: http://fr7.abbyy.com/fr70pro/FR70pro_en_ru.exe>http://fr7.abbyy.com/fr70pro/FR70pro_en_ru.exe
      Кряк с инструкциями вышлю по запросу.


387. Ихтик, Уфа (iht57@mail.ru) 18:51:59 [ответить]
      Слышал я тут упоминалось об синтезе компьютером человеческой речи из электронной текстовки. Скажу по откровенности - замечательнейшая вещь, читаю, вернее слушаю книги этим способом уже года два и не нарадуюсь. Главное - привыкнуть. Всем кто интересуется ходить сюда:
      http://art.bdk.com.ru/govor/>http://art.bdk.com.ru/govor/
      http://www.vector-ski.ru/vecs/govorilka/>http://www.vector-ski.ru/vecs/govorilka/
      или писать мне.
     
      Ещё по поводу того, что Мошков ингорирует присылаемые к нему книги. Так ведь есть много других не менее замечательных библиотек, где всё берут с удовольствием и всегда говорят спасибо. :-*
     
      orel@rsl.ru, bsperli@rsl.ru (http://orel.rsl.ru/>http://orel.rsl.ru/ -Открытая русская электронная библиотека);
      moshkow@systud.msk.su, max@lib.ru (http://www.lib.ru>http://www.lib.ru -Библиотека Максима Мошкова);
      chrushka@hotmail.com, lemail@shaw.ca (http://russiantext.com/>http://russiantext.com/ -Всеобъемлющий архив русских текстов);
      admin@bestlibrary.ru (http://www.bestlibrary.ru/>http://www.bestlibrary.ru/);
      bestbooks@pisem.net (http://www.bestbooks.ru/>http://www.bestbooks.ru/ -BestBooks.RU - онлайн библиотека);
      library@odessa.net (http://virtlib.odessa.net/>http://virtlib.odessa.net/ -Большая Одесская Библиотека);
      info@bigmir.net (http://lib.bigmir.net/>http://lib.bigmir.net/ -Библиотека на bigmir)net);
      lib@post.km.ru (http://lib.km.ru/>http://lib.km.ru/ Электронная библиотека);
      info@saslib.ru (http://www.saslib.ru/>http://www.saslib.ru/ - Библиотека популярных текстов);
      Adm@booksite.ru, anonimous@au.ru,
      lohness@klondike.ru, serga_2002@mail.ru (http://www.nesenenko.narod.ru/>http://www.nesenenko.narod.ru/);
      vgershov@pochtamt.ru, Vladimr@mail.ru (http://vgershov.lib.ru/>http://vgershov.lib.ru/ - Электронные книжные полки Вадима Ершова и К╟);
      info@books.org.ua,
      kazak2@rambler.ru,
      forsas@mail.ru (http://scbooks.chat.ru/>http://scbooks.chat.ru/ -Библиотека Scan And Send);
      biblio@i-u.ru,
      webmaster@referats.com (http://lib.students.ru/>http://lib.students.ru/);
      library@till.ru (http://www.till.ru>http://www.till.ru);
      kalaus_l@mail.ru, Lib_Pavel@km.ru,
      aldebaran@mailru.com (http://aldebaran.ru/>http://aldebaran.ru/);
      alaraf@rbcmail.ru, Artefact@mx8.mail.ru,
      yuri@book.pp.ru (http://book.pp.ru/>http://book.pp.ru/ Библиотека "Biblio Net");
      andreev_yuri@mail.ru, koap@koap.ru (http://koapp.narod.ru/>http://koapp.narod.ru/);
      lib@rin.ru (http://lib.rin.ru/>http://lib.rin.ru/);
      stulchik@mail.ru (http://divanchik.net/>http://divanchik.net/);
      lib@prm.ru (http://lib.prm.ru/>http://lib.prm.ru/);
      moppa-moppa@mtu-net.ru (http://libmop.chat.ru/>http://libmop.chat.ru/ -Библиотека редких книг);
      rw@vinbazar.com,
      serga_2002@mail.ru (http://www.geocities.com/SoHo/Exhibit/4256/>http://www.geocities.com/SoHo/Exhibit/4256/ -Книжные полки Алексея Несененко);
      rr@vip-rus.com (http://www.reading-room.narod.ru/>http://www.reading-room.narod.ru/ -Электронная библиотека "Читальный зал");
      Vitaly Ponomarev (http://lib.align.ru/>http://lib.align.ru/);
     
      за координатами для специализированных библиотек обращайтесь ко мне - приглю...
     
     
      Каталоги электронных библиотек:
      ilya@russ.ru (http://www.russ.ru/krug/biblio/>http://www.russ.ru/krug/biblio/);
      admin@allbest.ru,
      library@till.ru (http://www.till.ru>http://www.till.ru);
      inkwell@kulichki.com (http://www.kulichki.com/inkwell/>http://www.kulichki.com/inkwell/ -Чернильница);
      alexen@dialup.ptt.ru (http://piramyd.express.ru/>http://piramyd.express.ru/);
      book-ru-owner@yahoogroups.com (http://www.1book.ru/>http://www.1book.ru/);
      book-ru-owner@yahoogroups.com (http://www.1book.ru/library.htm>http://www.1book.ru/library.htm - Каталог электронных библиотек);


СООБЩЕНИЯ ЗА 13.10.2003
388. Вячеслав Сачков, Троицк (nestor@inetcomm.ru) 02:17:23 [ответить]
      > 387. Ихтик.
      > Слышал я тут упоминалось об синтезе компьютером человеческой речи из электронной текстовки. Скажу по откровенности - замечательнейшая вещь, читаю, вернее слушаю книги этим способом уже года два и не нарадуюсь. Главное - привыкнуть. Всем кто интересуется ходить сюда:
      > http://art.bdk.com.ru/govor/>http://art.bdk.com.ru/govor/
      > http://www.vector-ski.ru/vecs/govorilka/>http://www.vector-ski.ru/vecs/govorilka/
      > или писать мне.
      >
      Ну, это вообще игрушки примитивные. Я лично пользую и рекомендую дигалу (особенно лицензионную, по сравнению с использующимися в массах крякнуто-обрезенными версиями это небо и земля) в связке с ридерттс, сакрамент тоже очень неплохо. Но безупречных бормоталок, к сожалению, пока еще вообще нет, а говорун, говорилка, говорящая мышь, пожалуй, - худшие из них. Кроме того, еще сравнительно недавно вирго-4 вышла - достаточно смешная бормоталка, с немецким акцентом. Зато у нее удобствий много.


389. Lexa, (lexahr@inbox.ru) 10:38:10 [ответить]
      > 379. V.Voblin.
      > > 372. Lexa.
      > > > 364. В.Воблин.
      > > > ...есть ли разница между сканерами по скорости прохода одной страницы...
      > >
      > > Есть. На моём текущем (UMAX Astra 4500) и предыдущем (Acer ScanPrisa640U) цифры соответственно таковы ...: 250 разворотов в час и 110 разворотов в час.
      >
      > Lexa, сердечное спасибо за обстоятельный ответ.
      > Интересно, какой интерфейс был у обоих ушпомянутых сканеров. USB?
     
      Да, у обоих USB


СООБЩЕНИЯ ЗА 15.10.2003
391. Tshitatel, 01:24:43 [ответить]
      > 389. Lexa.
      > > 379. V.Voblin.
      > > > 372. Lexa.
      > > > > 364. В.Воблин.
      > > > > ...есть ли разница между сканерами по скорости прохода одной страницы...
      > > >
      > > > Есть. На моём текущем (UMAX Astra 4500) и предыдущем (Acer ScanPrisa640U) цифры соответственно таковы ...: 250 разворотов в час и 110 разворотов в час.
      > >
      > > Lexa, сердечное спасибо за обстоятельный ответ.
      > > Интересно, какой интерфейс был у обоих ушпомянутых сканеров. USB?
      >
      > Да, у обоих USB
     
      Rekomenduju -
      Epson 1660-Photo - USB2 (kartu mozno i oddelno kupit dlia starich PC) rabotajet i s USB-starim no ostonavlivajetsia po doroge - po vremeni 2-4 sek medlenneje tshem s USB2.
      S USB2:
      Serij-400dpi za 11 sek. (A4)
      Tsherno-belij 300 dpi za 9 sek.
      A5 - 7-5 Sek.
      Mozno i Foto-Negativi skanirovat (imejet dopolnenije - lampu v krishke)
     
      Ostovaites s FineReader 4 !!! Nenado dengi zria tratit!


392. slava, москва (slavaaa@yandex.ru) 12:52:36 [ответить]
      Тема обсуждения стандарта эл.книг в Интернете.
      http://yanko.lib.ru/books/yanko_slava-books.htm>http://yanko.lib.ru/books/yanko_slava-books.htm


Continue