От Владислав Ответить на сообщение
К ППД Ответить по почте
Дата 07.02.2003 04:20:44 Найти в дереве
Рубрики WWII; Версия для печати

Болтшое спасибо за постинг. НО! (+)

Приветствую!

Изначально речь шла о достоверности данных московского ЦБД и цифры в 20 миллионов боевых потерь. Вы же привели информацию о механизме и погрешностях работы при составлении РЕГИОНАЛЬНЫХ Книг Памяти. Соответственно, остаются вопросы:

а) По всем ли регионам существуют Книнги Памяти?

б) Сколько фамилий погибших содержится суммарно ВО ВСЕХ Книгах Памяти?

>Доля дубликатов в базе данных ВНИИДАД значительна. Моя оценка - до 20 % (не обязательно - 20, но до 20 - в зависимости от буквы, региона, и т.п.).

Хорошо. Примем эту цифру. С уточнением -- по каждому региону. То есть при суммировании данных из нескольких регионов процент будет расти, так как один и тот же человек может учитываться по данным нескольких регионов.

>По моему деду - три распечатки, все разные (разные источники).

О! То есть человека посчитали не ДВА, а уже ТРИ раза. "Вот так и рождаются нездоровые сенсации" (с) АБС

>При обработке распечаток по буквам А-З у нас выявилось наличие 13-15 % повторов по разным буквам. Еще не обработаны самые массовые буквы (К, М, П, С). Учитывая отсутствие в области около 30 % распечаток (как мы считаем), сказать - сколько же у нас дублей - непросто. В более ранних ответах на вопросы я говорил о выявленных повторах, и каждый день прибавляет 1-2 к ним. Их уже более 4700. Но ведь это повторы не столько одинаковых ФИО (их 1/3), а разнопрочитанных ФИО (АРТЕЕВ и АРДЕЕВ, БАТЫГИН и БОТЫГИН, и т.д.), а человек-то один! Сколько же таких в БД ВНИИДАД. Только что выловил у моего оператора: внесла как нового человека БОГОЧОВА, а он просто БОГАЧЕВ и был уже в БД. На обоих есть распечатки ВНИИДАД, разнятся на немного (на написание фамилии).


ВНИМАНИЕ! То есть учтены только повторы из-за ошибок в написании фамилий? И уже их набралось до 20 процентов??? Мнэ-э, а представиьте себе, сколько у нас в стране людей с одинаковыми фамилиями, именами и даже отчествами. Потикаким признакам их будут отличать?

Правильно -- по дате рождения, дате призыва, месту жительства и т.д. А если в какой-нибудь из этих пунктов тоже вкрадется очепятка?

>Касаясь базы данных ВНИИДАД. Не она стала основой для создания региональных Книг Памяти. Процент использования распечаток в регионах составил от 50 до 80 %.

То есть на ошибки в ЦБД дополнительно накладываются свои? 10 % там, 20 % здесь -- это уже будут сорок процентов...

>Методика подчета? Вот Вам погрешность в 3 миллиона (замечу о 10 миллионах я и не заикался)

10 миллионов -- это погрешность ЦБД, если сравнивать ее с другими методиками подсчета.

Вопрос, собственно говоря, заключается в том, что достовернее -- методика Кривошеева или методика ЦБД? Лично я затрудняюсь представить себе факторы, ведущие к появлянию в Кривошеевской методике хотя бы 20% погрешности (если вы знаете такие -- я готов вас выслушать). В то же время для методики ЦБД 20% погрешность считается нормальной. Думаю, это лучше всего говорит о том, какая методика научнее.

Поймите, доказать "приблизительную достоверность и относительную надежность" методики ЦБД мало -- надо сначала доказать ненадежность и недостоверность методики Кривошеева. А это пока не сделал никто. Хотя боря соколов -- пытался...

>>Напомнб еще раз: наблюдается расхождеие НЕ ТОЛЬКО с цифрами Кривошеева, но с данными ВСЕХ ОСТАЛЬНЫХ методик подсчета демографических потерь. В то время как данные Кривошеева хорошо коррелруют с данными, полученными на основании прочих методик. А это -- смертный приговор методике ЦБД.
>
>Вот тебе раз! Мы вроде как про боевые потери-то разговор ведем. Нам бы хоть с ними разобраться. Демографические потери, это уже другая "опера"...

Уже ответил Maeron. Когда согласно методике ЦБД боевые потери начинают перехлестывать общедемографические, возникает сомнение в самой методике.

С уважением

Владислав