От Константин Федченко
К Rustam Muginov
Дата 31.03.2003 22:29:16
Рубрики Современность; Загадки;

Re: PDF???

>Здравствуйте, уважаемые.
>>Не подскажет ли кто, как работать с файлами этого формата. А именно, как переводить их в текстовый формат?
>
>>Желательно попроще объяснить:))
>
>Работать можно либо с помощью бесплатного ПО Adobe Acrobate Reader (скачивается с сайта Адоба), либо с помощью коммерческого Adobe Acrobat Exchange.

>К этим продуктам (или только к Exchange?) есть ряд плагинов, которые позволяют экспортировать текст, RTF, и так далее.

а где их взять?

>Формат PDF (Portable Document Format) изначально разработан для электронных документов, не зависимых от компьютера/операционуки/прочего. Грамотный PDF на любом компьютере будет выглядеть/печататься именно так как его задумал создатель,

cкажем, данная книга печатается очень нечетко - отсканировать и распознать не удастся почти ничего.

>в отличии от постоянно "расползающихся" документов ворда.


>Поэтому ПДФ - идеальный носитель для "статических" документов, которые не предназначенны для редактирования - своего рода "электронная книга"
>Пожалуйста, не надо портить документы - не переводите их в Ворд!

если нет возможности свободно пользоваться фрагментом документа - никакого удовольствия от формата не получаешь. поэтому для меня лично "портить" документы - значит переводить их в pdf
>С уважением, Рустам Мугинов.
С уважением

От Rustam Muginov
К Константин Федченко (31.03.2003 22:29:16)
Дата 31.03.2003 22:50:55

Re: PDF???

Здравствуйте, уважаемые.


>>К этим продуктам (или только к Exchange?) есть ряд плагинов, которые позволяют экспортировать текст, RTF, и так далее.
>
>а где их взять?

Купить. Или - у пиратов.

>
>cкажем, данная книга печатается очень нечетко - отсканировать и распознать не удастся почти ничего.

Пардон?
Значит Ваш ПДФ - это на самом деле набор растровых картинок?
Тогда это действительно не самый лучший пример. Ничем не отличается от набора GIF файлов ;)

Проведите эксперимент.
Запустите Акробат и нажмите кнопочку "T" на тулбаре. Попытайтесь выделить фрагмент текста. Если не получится - то у вас растровое представление страничек, увы. То есть PDF в Вашем случае используется лишь как "обертка" для tiff/gif.
Нужен OCR. Или набитие вручную.

>>Поэтому ПДФ - идеальный носитель для "статических" документов, которые не предназначенны для редактирования - своего рода "электронная книга"
>>Пожалуйста, не надо портить документы - не переводите их в Ворд!
>
>если нет возможности свободно пользоваться фрагментом документа - никакого удовольствия от формата не получаешь. поэтому для меня лично "портить" документы - значит переводить их в pdf

"Это потому что у вас не умеют готовить долма" ;)
Это потому что вы не до конца понимаете что такое ПДФ.
См. выше.


С уважением, Рустам Мугинов.

От Константин Федченко
К Rustam Muginov (31.03.2003 22:50:55)
Дата 01.04.2003 11:29:36

конструктивное предложение ув. Рустаму Мугинову

>Здравствуйте, уважаемые.

>>cкажем, данная книга печатается очень нечетко - отсканировать и распознать не удастся почти ничего.

>Пардон?
>Значит Ваш ПДФ - это на самом деле набор растровых картинок?

Не мой - а книга, выложенная damdor.

>Тогда это действительно не самый лучший пример. Ничем не отличается от набора GIF файлов ;)

Вот именно - при том, что набор GIFов можно от-OCR-ить, и у него было бы разрешение лучше.

>Проведите эксперимент.
>Запустите Акробат и нажмите кнопочку "T" на тулбаре. Попытайтесь выделить фрагмент текста. Если не получится - то у вас растровое представление страничек, увы. То есть PDF в Вашем случае используется лишь как "обертка" для tiff/gif.

Именно так и есть.

>Нужен OCR. Или набитие вручную.

>>если нет возможности свободно пользоваться фрагментом документа - никакого удовольствия от формата не получаешь. поэтому для меня лично "портить" документы - значит переводить их в pdf

>Это потому что вы не до конца понимаете что такое ПДФ.

Не я один, как видите. Когда мне надо книгу перевести в электронный вид - я ее сканирую, распознаю, перевожу в Word или html. если трудно распознать - оставляю в виде набора графических файлов.
Поэтому, если вы располагаете большими познаниями в Акробате, и можете сделать ПРАВИЛЬНЫЙ ПДФ - который и макетируется красиво, и таскать фрагменты из него можно - тогда огромная просьба к Вам - проведите тут ликбез для всех, кто занимается работой с книгами В-И содержания.
Естественно, хотелось бы это все увидеть в виде четкой пошаговой детальной инструкции - начиная от "Возьмите книгу и сканер" и заканчивая готовым файлом, пригодным для полноценной работы с электронной книгой.

И благодарность наша не будет иметь границ ))
>С уважением, Рустам Мугинов.
С уважением

От Rustam Muginov
К Константин Федченко (01.04.2003 11:29:36)
Дата 01.04.2003 12:09:16

Постараюсь ответить по пунктам.

Здравствуйте, уважаемые.
>
>Не мой - а книга, выложенная damdor.

Можно для УРЛ для "медленного газа" ;)?

>>Тогда это действительно не самый лучший пример. Ничем не отличается от набора GIF файлов ;)
>
>Вот именно - при том, что набор GIFов можно от-OCR-ить, и у него было бы разрешение лучше.

Разрешение НИКАК не связанно с форматом, пожалуйста поймите это.
Если вам итересно, могу предложить GIF в 72 DPI и PDF (растр) в 2400.
Могу и обратное.
Формат - это всего-навсего обертка, конверт. Что вы в него положите - то и будет.


>Поэтому, если вы располагаете большими познаниями в Акробате, и можете сделать ПРАВИЛЬНЫЙ ПДФ - который и макетируется красиво, и таскать фрагменты из него можно - тогда огромная просьба к Вам - проведите тут ликбез для всех, кто занимается работой с книгами В-И содержания.
>Естественно, хотелось бы это все увидеть в виде четкой пошаговой детальной инструкции - начиная от "Возьмите книгу и сканер" и заканчивая готовым файлом, пригодным для полноценной работы с электронной книгой.


Хорошо, но только немного уточнений.
1) Можно я опущу шаги "сканер" и "OCR"?
Они ничем не отличаются от того что нужно для ворда.

2) Что является желаемым конечным результатом?
Файлики для чтения с экрана? Для печати? Для полиграфии?
Полноцвет или ч/б?

3) Что конкретно вы хотите делать с этим результирующем файлом?
Полностью и по пунктам.


С уважением, Рустам Мугинов.

От Сергей Зыков
К Rustam Muginov (31.03.2003 22:50:55)
Дата 01.04.2003 02:32:11

Re: PDF???

>Запустите Акробат и нажмите кнопочку "T" на тулбаре. Попытайтесь выделить фрагмент
Лучше дать максимальное увеличение на фрагмент текста - там должна вылезти лесенка из пикселей больше 300-600 dpi для текста никто в PDF не будет делать.

>"Это потому что у вас не умеют готовить долма" ;)
Поделились бы секретами своей кухни...
Вам бы рекламные тексты писать для "Адоба" :с) талант зарываете.
Этот идеальный носитель кроме приятной на вид морды имеет свою "заднюю часть" с копытами которая лягает непонятно за что и как. PDF кстати некорректно воспроизводит родные *.PSD файлы по цвету. Гарантированно это получается с 2-цветовым (не дуал-тоне) режимом. Если верстать PDF-документ из Ворда то при выходе теста или фото за пределы дюймовой рамки, особенно с картинками, у меня размер файла выскакивал просто в геометрическую прогрессию. Вообщем у меня к ним много вопросов.

В "FinePrint pdfFactory" почему-то тестовая страница получается гораздо (кажется вдвое-втрое) меньше чем пропущенная через Adobe Acrobat Distiller. Правда надо вручную, в настройках выставить используемые шрифты иначе у других это читаться не будет. Скан (в цвете!) тоже значительно меньше чем такой же через Adobe Distiller. Хотя при всем том - би-тональные pdfFactory пакует гораздо хуже чем А-Distiller.

От Rustam Muginov
К Сергей Зыков (01.04.2003 02:32:11)
Дата 01.04.2003 10:15:57

Re: PDF???

Здравствуйте, уважаемые.

>>"Это потому что у вас не умеют готовить долма" ;)
>Поделились бы секретами своей кухни...
>Вам бы рекламные тексты писать для "Адоба" :с) талант зарываете.

Да, языком потрепать я люблю ;)

>Этот идеальный носитель кроме приятной на вид морды имеет свою "заднюю часть" с копытами которая лягает непонятно за что и как. PDF кстати некорректно воспроизводит родные *.PSD файлы по цвету.

Пардон это как так?
Откуда в PDF могут быть PSD файлы?


> Гарантированно это получается с 2-цветовым (не дуал-тоне) режимом. Если верстать PDF-документ из Ворда то при выходе

Ой... Верстать в Ворде - это надо быть очень мужественным человеком.

> теста или фото за пределы дюймовой рамки, особенно с картинками, у меня размер файла выскакивал просто в геометрическую прогрессию. Вообщем у меня к ним много вопросов.

>В "FinePrint pdfFactory" почему-то тестовая страница получается гораздо (кажется вдвое-втрое) меньше чем пропущенная через Adobe Acrobat Distiller.

А какие настройки дистиллера?
Там их оооочень много.

> Правда надо вручную, в настройках выставить используемые шрифты иначе у других это читаться не будет. Скан (в цвете!) тоже значительно меньше чем такой же через Adobe Distiller. Хотя при всем том - би-тональные pdfFactory пакует гораздо хуже чем А-Distiller.
С уважением, Рустам Мугинов.

От Василий Т.
К Константин Федченко (31.03.2003 22:29:16)
Дата 31.03.2003 22:35:29

Re: PDF???

Доброе время суток

>>Поэтому ПДФ - идеальный носитель для "статических" документов, которые не предназначенны для редактирования - своего рода "электронная книга"
>>Пожалуйста, не надо портить документы - не переводите их в Ворд!
>если нет возможности свободно пользоваться фрагментом документа - никакого удовольствия от формата не получаешь. поэтому для меня лично "портить" документы - значит переводить их в pdf

Здесь "непонятки" с форматом.
Дело в том, что существуют PDF-документы, сделанные из текстового файла (например, того же Word) как текстовые с возможностью поиска требуемых слов, фраз. Они действительно удобнее для работы, чем Word.
Но есть PDF-документы, сделанные как сборник "сканов". Вот именно в этих документах поиск невозможен, т.е. нет текста, в котором поиск производится.

С уважением, Василий Т.

От Константин Федченко
К Василий Т. (31.03.2003 22:35:29)
Дата 31.03.2003 22:39:57

Re: PDF???

>Доброе время суток

>>>Поэтому ПДФ - идеальный носитель для "статических" документов, которые не предназначенны для редактирования - своего рода "электронная книга"
>>>Пожалуйста, не надо портить документы - не переводите их в Ворд!
>>если нет возможности свободно пользоваться фрагментом документа - никакого удовольствия от формата не получаешь. поэтому для меня лично "портить" документы - значит переводить их в pdf
>
>Здесь "непонятки" с форматом.
>Дело в том, что существуют PDF-документы, сделанные из текстового файла (например, того же Word) как текстовые с возможностью поиска требуемых слов, фраз. Они действительно удобнее для работы, чем Word.

чем удобнее? в Ворде тоже есть поиск. А если они из него же и сделаны - пропадает объявленное преимущество "как задумано, так и печатает". Более того - поиск - это еще не все, копировать фрагменты все равно нельзя.

>Но есть PDF-документы, сделанные как сборник "сканов". Вот именно в этих документах поиск невозможен, т.е. нет текста, в котором поиск производится.

тем более - набор сканов графически куда лучше - и копийность есть, и просмотр в любом пакетном графредакторе (ACDSee), и распознать можно.

>С уважением, Василий Т.
С уважением

От Rustam Muginov
К Константин Федченко (31.03.2003 22:39:57)
Дата 31.03.2003 22:59:04

Re: PDF???

Здравствуйте, уважаемые.

>чем удобнее? в Ворде тоже есть поиск. А если они из него же и сделаны - пропадает объявленное преимущество "как задумано, так и печатает". Более того - поиск - это еще не все, копировать фрагменты все равно нельзя.

из "нормального" ПДФ - можно.

>
>тем более - набор сканов графически куда лучше - и копийность есть, и просмотр в любом пакетном графредакторе (ACDSee), и распознать можно.

Константин, вы видимо не понимаете самых азов компьютерной графики.
Векторные изображения обладают огромными преимуществами.
А именно - разници между растровым и векторным изображении.
Если вы действительно хотите получить консультацию по этому вопросу, позвоните мне завтра в рабочее время
245-1439 доб 115

А то тут нас модераторы пристрелят. И будут совершенно правы.

С уважением, Рустам Мугинов.

От Василий Т.
К Константин Федченко (31.03.2003 22:39:57)
Дата 31.03.2003 22:54:24

Re: PDF???

Доброе время суток
>>Дело в том, что существуют PDF-документы, сделанные из текстового файла (например, того же Word) как текстовые с возможностью поиска требуемых слов, фраз. Они действительно удобнее для работы, чем Word.
>чем удобнее? в Ворде тоже есть поиск. А если они из него же и сделаны - пропадает объявленное преимущество "как задумано, так и печатает". Более того - поиск - это еще не все, копировать фрагменты все равно нельзя.

Кроме поиска - в этом случае - работает и "выделить", "копировать".
Удобство же в том, что...
1) в такой файл нельзя ненароком внести изменения (например, "вырезал" и забыл, а затем случайно сохранил файл);
2) такой файл можно читать под любой ОС, а не только WinWord'ом

>>Но есть PDF-документы, сделанные как сборник "сканов". Вот именно в этих документах поиск невозможен, т.е. нет текста, в котором поиск производится.
>тем более - набор сканов графически куда лучше - и копийность есть, и просмотр в любом пакетном графредакторе (ACDSee), и распознать можно.

Но нет:
- возможности поиска контекста
- возможности копирования самого текста, а только как часть картинки (и соответственно - необходимость при работе с документом каждый раз набирать вручную сам текст)

Плюс же только в том, что документ будет смотреться "как книга". Но тогда проще купить саму книгу :o))

С уважением, Василий Т.

От Василий Т.
К Василий Т. (31.03.2003 22:54:24)
Дата 31.03.2003 23:19:37

Для примера... (+)

Доброе время суток

...я положил в "Копилку" т. 2 СБД в виде текстового PDF
[
https://vif2ne.org/nvk/forum/files/Tash_v/Issue02.pdf ]

Попробуйте поработать с ним в Acrobat Reader.

(Да, и обратите внимание на разницу в размере файла со "сканами" [около 6 МВ в "архиве"] и данного файла [около 900 КВ в "архиве"]).

С уважением, Василий Т.

От Андрей
К Василий Т. (31.03.2003 23:19:37)
Дата 31.03.2003 23:32:49

Re: Для примера...

>Доброе время суток

>...я положил в "Копилку" т. 2 СБД в виде текстового PDF
>[
https://vif2ne.org/nvk/forum/files/Tash_v/Issue02.pdf ]

>Попробуйте поработать с ним в Acrobat Reader.

>(Да, и обратите внимание на разницу в размере файла со "сканами" [около 6 МВ в "архиве"] и данного файла [около 900 КВ в "архиве"]).

Раз так, то все равно нужно сделать подробную инструкцию как создавать подобные текстовые ПДФ, и заодно такую же подробную для преобразования графических ПДФ в текст Ворд, ведь выкладывалась уже куча подобных файлов.

>С уважением, Василий Т.

От Василий Т.
К Андрей (31.03.2003 23:32:49)
Дата 31.03.2003 23:54:14

Re: Для примера...

Доброе время суток

>Раз так, то все равно нужно сделать подробную инструкцию как создавать подобные текстовые ПДФ, и заодно такую же подробную для преобразования графических ПДФ в текст Ворд, ведь выкладывалась уже куча подобных файлов.

Наверное, проще посмотреть описание процесса перевода из PDF в WinWord на "Милитере" - [
http://militera.lib.ru/ocr/index.html ]

Процесс перевода WinWord в "текстовый" PDF требует или денег или много времени :o))
Adobe Acrobat это делает автоматически (по рассказам), но стоит денег.
Я когда-то пробовал free - пришлось установить 3 разные последовательно выполняемые программы. Текст получился читаемым, но "двоящимся".

С уважением, Василий Т.

От VAF
К Василий Т. (31.03.2003 23:54:14)
Дата 01.04.2003 03:20:22

LaTeX

Данный процесс перевода WinWord в "текстовый" PDF требует довольно много времени зато какой результат.

Правда с нужной вставкой картинок проблема.

От Николай Поникаров
К VAF (01.04.2003 03:20:22)
Дата 01.04.2003 10:26:21

Применительно к данным книгам - TeX нафиг не нужен. Он рулит там, где формулы (-)


От Дм. Журко
К Николай Поникаров (01.04.2003 10:26:21)
Дата 01.04.2003 11:54:09

Он и там не "рулит", только традиция, привычка. Технология начала 80-ых

Здравствуйте.

Всё здешнее обсуждение MSWord сводится к тому, что люди не умеют его использовать и не ведают и о четверти его возможностей.

Формулы там нужно вводить без Equation Editor полями, я таким образом оформил не один учебник, в том числе изданный миллионными тиражами. Неоднократно демонстрировал математикам, пользующимся TeX, превосходство MSWord даже и в этом. Их единственное возражение — издательства требуют TeX. Моё сообщение является явным off topic, но не стерпел безосновательных наездов. Если кого-то интересует, обращайтесь за простыми разъяснениями. К сожалению, ни в одном пособии пользователям MSWord это простое средство — поле EQ — не описано. Однако, поле это позволяет изображать даже весьма сложные системы уравнений и конструировать новую математическую символику, если потребуется.

Кстати, .pdf можно готовить и в MSWord, .pdf — лишь один из удобных форматов передачи макета издателю или пользователю, не более. На этом его функции заканчиваются, там даже специально затруднены возможности дальнейшей правки, перевёрстки.

MSWord — самая удобная и мощная ныне программа для работы с текстом, со вполне адекватными возможностями вёрстки. Худое же мнение многих профессионалов о нём объясняется просто: на текст им, как правило, наплевать, их задача — дизайн, а не содержание, корректность. Проблемы же непрофессионалов возникают от избытка возможностей MSWord, потому неверного выбора средств (там часто есть можно достичь похожих результатов различными способами). MSWord — одна из самых мощных и продуманных программ, имеющиеся ошибки связаны с возможностями встраивания, интеграции с другими приложениями (например, Equation Editor, Corel, Excel), эти ошибки часто парируются богатыми встроенными возможностями.

Дискуссия здесь неуместна, потому ответить могу только лично.
Дмитрий Журко

От Rustam Muginov
К Дм. Журко (01.04.2003 11:54:09)
Дата 01.04.2003 12:11:58

Будте любезны...

Здравствуйте, уважаемые.

Просветите чайника, как в ворде быстро и удобно ввести формулу вроде (квадратный корень из (суммы пи и кубического корня из е)

Или как нарисовать реакцию окисления гидрохинона в хинон.

С уважением, Рустам Мугинов.

От Константин Федченко
К Константин Федченко (31.03.2003 22:39:57)
Дата 31.03.2003 22:43:59

Re: PDF???

>тем более - набор сканов графически куда лучше - и копийность есть, и просмотр в любом пакетном графредакторе (ACDSee), и распознать можно.

имел в виду - набор отсканированных картинок в графическом формате
>>С уважением, Василий Т.
>С уважением
С уважением