>Честно говоря не совсем понимаю, зачем ее в WORD загонять надо было 8((((
>По-моему, при распознавании возникает куча ошибок, которую Word кушает не моргнув глазом.
>Хотелось бы
>1. Если уж берется на себя труд отсканить книгу, то корректировать ошибки распознавания
Абсолютно верно. Если бы сканировал я - вычитал бы до последней цифры.
>2. Буде такое невозможно сделать то
>а. Предоставить оригиналы сканов с тем, чтобы это сделал тот, кто сможет.
>б. как вариант, сохранять распознанный текст в PDF формате. У него есть одна интересная особенность. Хорошо распознанный текст он сохраняет в текстовом формате, а то, что сомневается-в графическом. Получается и размер меньше, и по качеству претензий тоже меньше по сравнению с Word.
А сколько будут весить 620 страниц текста в PDF? Не думаю, что очень уж мало. К тому же WORD лучше жмется.
>А в таком формате, как сейчас, ценность этих документов довольно сомнительна. Особенно в разделе цифр. Просто не знаешь, где ожидать ошибок
> 8(((((