От PK Ответить на сообщение
К apple16 Ответить по почте
Дата 06.11.2007 16:03:01 Найти в дереве
Рубрики Администрации; Версия для печати

См мой коммент

... по поговорке: "жай дураку стеклянный.... кружку - разобьёт и ж-пу порежет".


>Также некоторые дожимают так, что и по тексту OCR толком не работает.
дожать до беспредела можно что угодно.


>Поэтому наилучшим форматом для первичного распостранения является
>скан в jpeg качества 8-10 на 300 DPI (Если мелованное фото - 600)

Вообще-то сканы для распознания стОит делать/хранить не в jpeg а в TIFF - потому что жпег тоже, между прочим, информацию теряет. Причём будучи форматом, заточенным для КАРТИНОК, с множеством цветов и плавными градациями, для ТЕКСТА (два цвета, НЕТ градаций) принципиально менее пригоден нежели другие алгоритмы, в т.ч. используемые в дежавю.


>djvu это эрзац для ленивых -
>Нажал педаль - книжка небольшого размера
>которую можно читать готова. А то, что потом ни фотографий
>из книжки выдрать, ни текст распознать - побоку.

Не так. При наличии желания можно сделать дежавюку которая с фото высокого качества, и подложенным распознанным текстом. При наличии уже готового дежавюшного файла можно распечатать его в набор картинок и распознать текст, и так далее. Было бы желание.


>Нет возможности маневра информацией в djvu
есть возможности.

>- электроные книжки не для того чтобы их читать, а чтобы драть из них
>и искать в них. :)

ну или печатать в высоком качестве и хранить.

В общем, ДеЖаВю есть формат принципиально ЛУЧШЕ заточенный для сканов книжек чем жпег. Ну а если матчасть неизучена...