От Сергей Вадов
К Дмитрий Кропотов
Дата 01.06.2006 13:19:52
Рубрики Ссылки; Тексты;

Re: Кстати, Буковский...

>Привет! Буковский переснял кучу документов из архива Президента РФ и др. в тот короткий период, пока они были открыты, и выложил их в интернет [2].
>Эта история для меня и других компьютерщиков
>
http://a-rakovskij.livejournal.com/25450.html давно представлялась откровенным враньем. Ну не было в то время такой аппаратуры, чтобы Буковский мог провернуть это дело. Тут и обсуждать нечего.

Странно, вроде jlm_taurus приводит разъяснения какого-то англоязычного товарища, как он ручным сканером сканировал и копировал на дискеты. Не могло такого быть ?

>А вот прямое свидетельтсво, что, по крайней мере один документ в архиве Буковского - подделка
> http://taki-net.livejournal.com/104518.html?#cutid1

Интересно. Скажите, Дмитрий, так все же, размещенный в интернете документ http://psi.ece.jhu.edu/~kaplan/IRUSS/BUK/GBARC/pdfs/dis70/kgb73-8.pdf является полной или урезанной копией оригинала ? Если урезанной, это весьма печально.

Сергей Вадов

От Дмитрий Кропотов
К Сергей Вадов (01.06.2006 13:19:52)
Дата 02.06.2006 11:58:42

Re: Кстати, Буковский...

Привет!
Привет!

>Интересно. Скажите, Дмитрий, так все же, размещенный в интернете документ
http://psi.ece.jhu.edu/~kaplan/IRUSS/BUK/GBARC/pdfs/dis70/kgb73-8.pdf является полной или урезанной копией оригинала ? Если урезанной, это весьма печально.
судя по всему, без купюр. Оба отрывка, изъятие которых инкриминируют Буковскому (о том, что Синявский сохранил свои взгляды и о разрешение выезда во Францию) - на месте.
Насколько я понял, муссируется история о первой публикации документа, к которой приложил руку Буковский. И вот в этом публикации - причем оба оппонента в обсуждении согласны - имелись купюры.
В интернет-версии, судя по всему, купюр нет.


>>Привет! Буковский переснял кучу документов из архива Президента РФ и др. в тот короткий период, пока они были открыты, и выложил их в интернет [2].
>>Эта история для меня и других компьютерщиков
>> http://a-rakovskij.livejournal.com/25450.html давно представлялась откровенным враньем. Ну не было в то время такой аппаратуры, чтобы Буковский мог провернуть это дело. Тут и обсуждать нечего.
>
>Странно, вроде jlm_taurus приводит разъяснения какого-то англоязычного товарища, как он ручным сканером сканировал и копировал на дискеты. Не могло такого быть ?
Дело в том, что сосканировать тот объем документов в тех условиях, о которых говорит Буковский - совершенно нереально. Он не профессиональный компьютерщик, а в то время не было ни спецпрограмм для облегчения сканирования, ни сканеры были не ахти.
Вы сами пробовали что-то сканировать ручным сканером?
Это дело очень трудоемкое, чреватое проблемами и неудачами.
Вот же что говорит Буковский:
"
Конечно, я знал, с кем буду иметь дело. Показать-то они покажут, уж коли пообещали, а вот скопировать не дадут, это точно. Ксероксы у них вечно будут сломаны, бумага — отсутствовать и т.д. и т.п. И потому я купил себе портативный компьютер и ручной сканнер. Я был уверен, что таких вещей в России пока никто не видел. Я сидел посредине зала Конституционного суда, передо мной лежали 48 томов документов, и спокойно сканировал их на глазах у всех. Никто из присутствовавших не понимал, что я делаю.
"
Портативный компьютер в 1991- это что-то. Тогда просто не было такой техники, что позволила бы провернуть эту работу.

"
Надо сказать, что это был суд очень высокого уровня. В качестве свидетелей проходили члены Политбюро, естественно, бывшие, секретари ЦК. С президентской стороны были вице-премьеры правительства, официальным представителем в начале был госсекретарь Бурбулис. И никто не понимал, что я делаю, но всех интересовал мой компьютер. В перерыве вокруг меня собиралась толпа. Члены Политбюро заглядывали через плечо и спрашивали: «Дорогая, наверное, машина?» Я коротко отвечал: «Дорогая».
"
http://community.livejournal.com/back_in_ussr/49771.html?thread=830571

Далее, Буковский говорит, что отсканировал около 7 тыс. документов. Вы представляете себе, какой это объем?

>Сергей Вадов
Дмитрий Кропотов, www.avn-chel.nm.ru

От Дм. Ниткин
К Дмитрий Кропотов (02.06.2006 11:58:42)
Дата 02.06.2006 14:24:42

Технический вопрос

>Портативный компьютер в 1991- это что-то. Тогда просто не было такой техники, что позволила бы провернуть эту работу.

Портативные компьютеры - были. Сам с таким ездил в командировку, еще в 1990 г.

>Далее, Буковский говорит, что отсканировал около 7 тыс. документов. Вы представляете себе, какой это объем?

По трудоемкости - очень большой. По объему необходимой памяти - тем более. Сомневаюсь, что он мог отсканировать за раз больше 100 страниц, дальше надо было делать backup на ленту. Версию распознавания "на лету", что сильно экономит объем, я сходу отметаю.

Так что насчет 7000 документов - сомнительно. Но что-то мог успеть.

От Дмитрий Кропотов
К Дм. Ниткин (02.06.2006 14:24:42)
Дата 05.06.2006 12:21:19

Я это и имел ввиду

Привет!
>>Портативный компьютер в 1991- это что-то. Тогда просто не было такой техники, что позволила бы провернуть эту работу.
>
>Портативные компьютеры - были. Сам с таким ездил в командировку, еще в 1990 г.
Это были машинки, в лучшем случае 486, с vga экраном, с Win 3.1., с винтом макс. 50-80 метров (а обычно 10-20 метров)
Подцепить к этому чуду сканер и реально работать - да еще в условиях полуподпольных... как то не верится.


>>Далее, Буковский говорит, что отсканировал около 7 тыс. документов. Вы представляете себе, какой это объем?
>
>По трудоемкости - очень большой. По объему необходимой памяти - тем более. Сомневаюсь, что он мог отсканировать за раз больше 100 страниц, дальше надо было делать backup на ленту. Версию распознавания "на лету", что сильно экономит объем, я сходу отметаю.
Распознавание - процессороемкая операция, ее и сейчас на лету тяжело делать. Т.е. сохранялись документы в графической форме, в виде образов страниц.

>Так что насчет 7000 документов - сомнительно. Но что-то мог успеть.
ОЧень сомневаюсь, что он был настолько продвинут в компьютерной области (пришлось покупать портативный компьютер, а не принести свой). Без опыта, без навыков.

Дмитрий Кропотов, www.avn-chel.nm.ru

От Сергей Вадов
К Дмитрий Кропотов (02.06.2006 11:58:42)
Дата 02.06.2006 13:08:53

Re: Кстати, Буковский...

>>Интересно. Скажите, Дмитрий, так все же, размещенный в интернете документ
http://psi.ece.jhu.edu/~kaplan/IRUSS/BUK/GBARC/pdfs/dis70/kgb73-8.pdf является полной или урезанной копией оригинала ? Если урезанной, это весьма печально.
>судя по всему, без купюр. Оба отрывка, изъятие которых инкриминируют Буковскому (о том, что Синявский сохранил свои взгляды и о разрешение выезда во Францию) - на месте.
>Насколько я понял, муссируется история о первой публикации документа, к которой приложил руку Буковский. И вот в этом публикации - причем оба оппонента в обсуждении согласны - имелись купюры.
>В интернет-версии, судя по всему, купюр нет.

Что ж, слава Богу, что так. Я не сталкивался никогда с распечаткой архива Буковского (судя по приведенному Вами обсуждению, так и не выяснено, кто именно на пути от файла к публикации вырезал часть текста), для меня архив Буковского = те файлы, которые он сосканировал и которые лежат в интернете. Откровенно говоря, очень огорчился, прочитав, что, быть может, там лежат фальсификаты. Сейчас, видимо, скорее правильно считать, что там лежат верные файлы.

>>Странно, вроде jlm_taurus приводит разъяснения какого-то англоязычного товарища, как он ручным сканером сканировал и копировал на дискеты. Не могло такого быть ?
>Дело в том, что сосканировать тот объем документов в тех условиях, о которых говорит Буковский - совершенно нереально. Он не профессиональный компьютерщик, а в то время не было ни спецпрограмм для облегчения сканирования, ни сканеры были не ахти.
>Вы сами пробовали что-то сканировать ручным сканером?
>Это дело очень трудоемкое, чреватое проблемами и неудачами.

Дмитрий, у меня меньше компьютерный опыт, чем у Вас, мне не довелось пользоваться ручным сканером, и не знаю принцип его работы. Однако, предлагаю подойти к вопросу с естественнонаучной точки зрения, абстрагировавшись на время от вопроса оценки личных качеств Буковского, по которому мы, видимо, имеем разные точки зрения. Вопрос - насколько реалистично в 1991 году отсканировать 7000 документов и сколько времени это могло бы занять? Можно высказать оценку снизу - ясно, что ручной сканер работал не хуже, чем фотоаппарат (иначе бы зачем им вообще пользоваться). Фотоаппаратом я неоднократно переснимал интересующие части книг, это вполне работает. Если на пересъемку страницы с учетом перелистывания отвести 10 секунд (эта оценка завышена, если потратить время и сделать удобный штатив, будет быстрее), на 7000 страниц нужно 70000 секунд, т.е. 19 часов рабочего времени. Даже если считать, что замена пленки и поход на новым томом занимают столько же времени, выйдет 38 часов = меньше недели работы (hm, даже забавно, а на что Буковский 2 месяца потратил?).

У меня в то время был доступ только к пленочному фотоаппарату - посмотрел сейчас историю цифровой фотографии в [1]: первая цифровая фотокамера MV-101, передававшая изображение по кабелю в компьютер DEC PDP-8/E, появилась в 1976 году. В 1988 году появилась первая программа для обработки изображений на компьютере, а к 1991 году уже несколько фирм серийно выпускали вполне похожие на современные камеры с разрешением почти в 1 мегапиксель, с внешним сменным жестким диском либо с возможностью подключить к компьютеру и скидывать туда данные сразу и т.д. (см. там же). Вероятно, стоили такие устройства недешево, но у Буковского, можно ожидать, были возможности найти деньги. Раз он привез из США ноутбук и ручной сканер, значит, кто-то в США изучил рынок и принял решение, что для данной цели лучше подходят ноутбук + ручной сканер, т.е. они не хуже, чем ноутбук + цифровая фотокамера или фотокамера с сменным внешним жестким диском или просто пленочный фотоаппарат и гора пленки. Кстати, Буковский уже не молод, не уверен, что он четко понимал в 1991 году разницу между понятиями "ручной сканер" и "цифровая фотокамера", эти предметы ведь и в США были в то время в новинку. Я и сам не очень понимаю, а в чем, собственно, отличие?

Таким образом, мне кажется, что с задачей сканирования 7000 страниц в 1991 году я бы (имея финансовые ресурсы на приобретение серийно выпускающейся техники) справился. Во всяком случае, это не выглядит очевидно невозможным (возможно, из качества доступных в интернете файлов можно вытянуть какую-то дополнительную информацию, позволяющую сильнее оценить снизу время на работу с одной страницей, но тут я не специалист, м.б. кто-то из читателей может высказаться?).

С уважением,
Сергей Вадов
[1] http://ru.wikipedia.org/wiki/История_цифровой_фотографии

От Дмитрий Кропотов
К Сергей Вадов (02.06.2006 13:08:53)
Дата 05.06.2006 12:26:15

Фотоизображения

Привет!
непригодны для распознавания.
> Вопрос - насколько реалистично в 1991 году отсканировать 7000 документов и сколько времени это могло бы занять?
Ручным сканером с портативным компьютером - несколько месяцев.

>Можно высказать оценку снизу - ясно, что ручной сканер работал не хуже, чем фотоаппарат (иначе бы зачем им вообще пользоваться). Фотоаппаратом я неоднократно переснимал интересующие части книг, это вполне работает.
Переснятое непригодно для распознавания текста - перекосы, сбои в фокусе и т.д.

> Если на пересъемку страницы с учетом перелистывания отвести 10 секунд (эта оценка завышена, если потратить время и сделать удобный штатив, будет быстрее), на 7000 страниц нужно 70000 секунд, т.е. 19 часов рабочего времени.

> Даже если считать, что замена пленки и поход на новым томом занимают столько же времени, выйдет 38 часов = меньше недели работы (hm, даже забавно, а на что Буковский 2 месяца потратил?).
Сканирование на компьютере - _гораздо_ более времяемкий процесс, чем фотографирование.
Даже совр. планшетный сканер любительского класса сканирует одну страницу от полминуты до минуты, реально не получается сканировать быстрее, чем страницу в минуту. С ручным сканером ситуация еще хуже, так как, зачастую, одного прохода для скана страницы недостаточно - нужно две полосы просканировать.

Т.е. умножьте ваше время на 100.

Дмитрий Кропотов, www.avn-chel.nm.ru

От Сергей Вадов
К Дмитрий Кропотов (05.06.2006 12:26:15)
Дата 05.06.2006 12:51:29

Дела технические.

Дмитрий, добрый день!

Трудно вести дискуссию с человеком, который лучше разбирается в сканировании и вообще (в отличие от меня) знает физику ;-). Расскажу лишь о собственном опыте: переснимаемое на цифровой фотоаппарат распознается программой FineReader начиная с разрешения 1600x1200; после сегодняшней камеры (4-мегапискельной) как русский, так и английский текст распознается вполне качественно. На планшетном сканере Canon (модели 2001 года) можно добиться сканирования за 12 секунд, если отключить цвет, отключить глубину (т.е. выставить monochrome, а не greyscale), выставить низкое разрешение (вместо 1200x1200 поставить 300x300). Мне ответил коллега, у которого есть ручной сканер HP capshare 910. Скорость сканирования страницы A4: 6 секунд (он сразу сканирует, понимая, что это текст, а не фотография, я не пользовался приборчиком, но видел файлы, они сразу маленькие).

Кроме того, если Ваша оценка верна, и Буковскому было нужно несколько месяцев для сканирования 7000 документов - не видно противоречия (казалось бы, у него и было несколько месяцев) ?

Позвольте спросить, какова Ваша точка зрения - Вы считаете, что Буковский приврал, рассказывая, что все отсканировал сам (а реально, например, заплатил еще 3 девочкам), или же что сами его файлы получены не с оригиналов в архиве ЦК КПСС и архиве Президента РФ, а фальшивки, созданные на компьютере ?

Сергей Вадов

От Дмитрий Кропотов
К Сергей Вадов (05.06.2006 12:51:29)
Дата 05.06.2006 14:17:06

Re: Дела технические.

Привет!

> Расскажу лишь о собственном опыте: переснимаемое на цифровой фотоаппарат распознается программой FineReader начиная с разрешения 1600x1200;
Для этого нужно весьма точное позиционирование, скажем, укрепление камеры на штативе. С рук добиться качественного фотоизображения, пригодного для файнридера не получится.

> после сегодняшней камеры (4-мегапискельной) как русский, так и английский текст распознается вполне качественно. На планшетном сканере Canon (модели 2001 года) можно добиться сканирования за 12 секунд, если отключить цвет, отключить глубину (т.е. выставить monochrome, а не greyscale), выставить низкое разрешение (вместо 1200x1200 поставить 300x300). Мне ответил коллега, у которого есть ручной сканер HP capshare 910. Скорость сканирования страницы A4: 6 секунд (он сразу сканирует, понимая, что это текст, а не фотография, я не пользовался приборчиком, но видел файлы, они сразу маленькие).
Capshare - это довольно продвинутая модель. С ручными сканерами 90х годов надо сравнивать, скорее, планшетные любительские сегодняшние.
http://www.ixbt.com/digimage/hp-capshare910.html


Есть, безусловно, сканеры промышленного класса, предназначенные для быстрого сканирования. Но речь-то о том, что обычный любительский сканер такой скорости не показывает.



>Кроме того, если Ваша оценка верна, и Буковскому было нужно несколько месяцев для сканирования 7000 документов - не видно противоречия (казалось бы, у него и было несколько месяцев) ?
Для сканирования и обработки 1 (одной) страницы документа (с учетом сохранения в памяти компьютера) требовалось на том уровне техники не менее 1 минуты.
Лично мне не удавалось сканировать на любительском сканере быстрее, чем 2 страницы в минуту (опыт сканирования - несколько десятков книг) без распознавания) - но это на совр. компьютере, с совр. планшетным (хотя и любительского уровня) сканером.
Поэтому я категорически не верю в возможность сканирования 7000 тыс. документов менее чем за 7 тыс. минут.


>Позвольте спросить, какова Ваша точка зрения - Вы считаете, что Буковский приврал, рассказывая, что все отсканировал сам (а реально, например, заплатил еще 3 девочкам), или же что сами его файлы получены не с оригиналов в архиве ЦК КПСС и архиве Президента РФ, а фальшивки, созданные на компьютере ?
История введения документов в оборот, обозначенная Буковским, вызывает слишком много вопросов. До прояснения этой истории к этим документам нельзя относится без недоверия.
Если неясно, как документы были введены в научный оборот - доверия к ним нет.
Вполне возможно, что вся история была затеяна для легализации нескольких фальшивок, например, такого уровня, как катынские документы.

>Сергей Вадов
Дмитрий Кропотов, www.avn-chel.nm.ru

От Сергей Вадов
К Дмитрий Кропотов (05.06.2006 14:17:06)
Дата 05.06.2006 15:12:33

Пусть будет так.

>> Расскажу лишь о собственном опыте: переснимаемое на цифровой фотоаппарат распознается программой FineReader начиная с разрешения 1600x1200;
> Для этого нужно весьма точное позиционирование, скажем, укрепление камеры на штативе. С рук добиться качественного фотоизображения, пригодного для файнридера не получится.

Естественно, снимать удобнее со штативом (но, к слову, и без штатива распознается, хотя и не так хорошо). FineReader - великая вещь.

> Есть, безусловно, сканеры промышленного класса, предназначенные для быстрого сканирования. Но речь-то о том, что обычный любительский сканер такой скорости не показывает.

Думаю, Буковский мог найти спонсоров на любой сканер, который был нужен.

> История введения документов в оборот, обозначенная Буковским, вызывает слишком много вопросов. До прояснения этой истории к этим документам нельзя относится без недоверия. Если неясно, как документы были введены в научный оборот - доверия к ним нет. Вполне возможно, что вся история была затеяна для легализации нескольких фальшивок, например, такого уровня, как катынские документы.

Что ж, доверяю Вам тут, как специалисту - история сканирования вызывает вопросы. Хочу обратить Ваше внимание на другой аспект проблемы - эти документы фигурировали в "деле КПСС", рассматривавшемся в Конституционном Суде. Т.е. дальнейшая их секретность с точки зрения интересов страны бессмысленна - слишком много людей их видело или могло видеть, ясно, что если ЦРУ для чего-то нужен был какой-то документ, его в тот момент пересняли. В США в такой ситуации можно ожидать, что документы будут доступны в интернете на сайте министерства юстиции. У нас нет ничего подобного - и именно поэтому мы вынуждены пользоваться сканами Буковского с его вызывающей вопросы техникой сканирования. Если бы на государственном сайте в РФ можно было бы ознакомиться с этими документами - никаких вопросов бы не возникало. Но нет, у нас так не делают, увы.

Сергей Вадов

От Дмитрий Кропотов
К Сергей Вадов (05.06.2006 15:12:33)
Дата 05.06.2006 15:32:07

Это еще полбеды

Привет!

документы, представленные на процессе КПСС (например, катынский пакет) не проходили экспертизу на подлинность.
Т.е. суд не назначил этой экспертизы, т.к. после высказывания претензий, обвинение сняло эти документы.

>сканирования. Если бы на государственном сайте в РФ можно было бы ознакомиться с этими документами - никаких вопросов бы не возникало. Но нет, у нас так не делают, увы.

>Сергей Вадов
Дмитрий Кропотов, www.avn-chel.nm.ru

От Сергей Вадов
К Дмитрий Кропотов (05.06.2006 15:32:07)
Дата 06.06.2006 16:27:15

Весьма печально.

> документы, представленные на процессе КПСС (например, катынский пакет) не проходили экспертизу на подлинность. Т.е. суд не назначил этой экспертизы, т.к. после высказывания претензий, обвинение сняло эти документы.

Дмитрий, добрый день!

Эти подробности весьма печальны. Очень жаль, что у нас нет традиции помещения имеющих важность документов в общественный доступ. И даже по такому знаковому делу имеются расхождения не то что на уровне оценок - даже на уровне документов. Весьма грустно.

Сергей Вадов