От apple16 Ответить на сообщение
К All Ответить по почте
Дата 30.10.2015 20:52:10 Найти в дереве
Рубрики WWII; 1941; Версия для печати

ОБД "Память Народа"

Можно бесконечно долго обсуждать какие нехорошие люди постановщики задач в ОБД "Память Народа" и почему они не хотят помогать работе исследователей и даже все больше мешают. Почему у них неправильный подход к представлению данных и тп Но это не очень конструктивно - им плевать на мнение обшественности и деньги они получают не за это. Попытки диалога только ухудшают ситуацию - граджане вместо капитуляции продолжают упорно защищать свою точку зрения.

Однако можно игнорировать пользовательский интерфейс ОБД и
просто принять как должное наличие некоторого количества дел ЦАМО и РГАВМФ в пубичном доступе.

Что первое стоит сделать - понять что у нас вообще есть.
Путем несложных махинаций удалось сделать каталог дел из раздела dou ОБД "Память Народа" по состоянию на начало октября 2015 года

72 метра
~3 миллиона документов (большинство в один лист)
https://drive.google.com/file/d/0Bw165TffqAYecklSUUtXeE9hYVE/view?usp=sharing
можно при желании сделать Excel, но мне с текстом в UTF-8 проще

Я попробую подверстать сюда же раздел ЖБД и старый "Подвиг Народа" (его каталог есть тут
www.teatrskazka.com/Raznoe/Fondy_TsAMO/common_list_main.html )

Также надо отладить еще систему мониторинга активности в ОБД - если что новое появится обновлять каталог.

Следуюший шаг видимо на документальной базе ОБД начать строить дерево формирований с учетом всех переводов и переподчинений.
Элементы этой работы в интернете есть
(Справочник
http://samsv.narod.ru/Div/Sd/sd025/default.html
и Википедия на нем нарисованная), но тут просто больше данных.
Потом поднять офицеров. Поднять населенные пункты. Дальше много чего можно сделать. Но нужны энтузиасты по конкретным местностям и армиям. (таких много кстати - даже школьники могут с этой работой справится)

Фактически любой студент на базе документов ОБД сейчас может в узкой области продвинуться дальше чем исследователь долгие годы с энтузиазмом копающий тему.

В частности доступные 50 гигабайт дел по Приморской армии
как минимум удваивают, а то и утраивают знания того же тов. Неменко
http://samlib.ru/n/nemenko_a_w/sostav.shtml

Из недостатков стоит отметить что в Элар не проверяли распознанный контент
со смысловой точки зрения - 59 сп с 54 сп путают постоянно.
(тут и нужна структура формирований по датам)

Ну а дальше можно и на людей и на 58 фонд выйти - по донесениям знать сколько людей было в батальонах и кого из них можно опознать и привязать.
Выйти на уровень американской ГВ. 100 миллионов записей это немного по современным меркам. Кривошеев это конечно хорошо, но реально есть шансы получить уточнения на индивидуальном уровне.
И кстати получить конечную цель ОБД - про каждого знать боевой путь в деталях, знать с кем он служил (хотя увы уже поздно), знать боевые эпизоды
(из 33 фонда поднять).