>>cкажем, данная книга печатается очень нечетко - отсканировать и распознать не удастся почти ничего.
>Пардон?
>Значит Ваш ПДФ - это на самом деле набор растровых картинок?
Не мой - а книга, выложенная damdor.
>Тогда это действительно не самый лучший пример. Ничем не отличается от набора GIF файлов ;)
Вот именно - при том, что набор GIFов можно от-OCR-ить, и у него было бы разрешение лучше.
>Проведите эксперимент.
>Запустите Акробат и нажмите кнопочку "T" на тулбаре. Попытайтесь выделить фрагмент текста. Если не получится - то у вас растровое представление страничек, увы. То есть PDF в Вашем случае используется лишь как "обертка" для tiff/gif.
Именно так и есть.
>Нужен OCR. Или набитие вручную.
>>если нет возможности свободно пользоваться фрагментом документа - никакого удовольствия от формата не получаешь. поэтому для меня лично "портить" документы - значит переводить их в pdf
>Это потому что вы не до конца понимаете что такое ПДФ.
Не я один, как видите. Когда мне надо книгу перевести в электронный вид - я ее сканирую, распознаю, перевожу в Word или html. если трудно распознать - оставляю в виде набора графических файлов.
Поэтому, если вы располагаете большими познаниями в Акробате, и можете сделать ПРАВИЛЬНЫЙ ПДФ - который и макетируется красиво, и таскать фрагменты из него можно - тогда огромная просьба к Вам - проведите тут ликбез для всех, кто занимается работой с книгами В-И содержания.
Естественно, хотелось бы это все увидеть в виде четкой пошаговой детальной инструкции - начиная от "Возьмите книгу и сканер" и заканчивая готовым файлом, пригодным для полноценной работы с электронной книгой.
И благодарность наша не будет иметь границ ))
>С уважением, Рустам Мугинов.
С уважением
Здравствуйте, уважаемые.
>
>Не мой - а книга, выложенная damdor.
Можно для УРЛ для "медленного газа" ;)?
>>Тогда это действительно не самый лучший пример. Ничем не отличается от набора GIF файлов ;)
>
>Вот именно - при том, что набор GIFов можно от-OCR-ить, и у него было бы разрешение лучше.
Разрешение НИКАК не связанно с форматом, пожалуйста поймите это.
Если вам итересно, могу предложить GIF в 72 DPI и PDF (растр) в 2400.
Могу и обратное.
Формат - это всего-навсего обертка, конверт. Что вы в него положите - то и будет.
>Поэтому, если вы располагаете большими познаниями в Акробате, и можете сделать ПРАВИЛЬНЫЙ ПДФ - который и макетируется красиво, и таскать фрагменты из него можно - тогда огромная просьба к Вам - проведите тут ликбез для всех, кто занимается работой с книгами В-И содержания.
>Естественно, хотелось бы это все увидеть в виде четкой пошаговой детальной инструкции - начиная от "Возьмите книгу и сканер" и заканчивая готовым файлом, пригодным для полноценной работы с электронной книгой.
Хорошо, но только немного уточнений.
1) Можно я опущу шаги "сканер" и "OCR"?
Они ничем не отличаются от того что нужно для ворда.
2) Что является желаемым конечным результатом?
Файлики для чтения с экрана? Для печати? Для полиграфии?
Полноцвет или ч/б?
3) Что конкретно вы хотите делать с этим результирующем файлом?
Полностью и по пунктам.