|
От
|
apple16
|
|
К
|
All
|
|
Дата
|
30.10.2015 20:52:10
|
|
Рубрики
|
WWII; 1941;
|
|
ОБД "Память Народа"
Можно бесконечно долго обсуждать какие нехорошие люди постановщики задач в ОБД "Память Народа" и почему они не хотят помогать работе исследователей и даже все больше мешают. Почему у них неправильный подход к представлению данных и тп Но это не очень конструктивно - им плевать на мнение обшественности и деньги они получают не за это. Попытки диалога только ухудшают ситуацию - граджане вместо капитуляции продолжают упорно защищать свою точку зрения.
Однако можно игнорировать пользовательский интерфейс ОБД и
просто принять как должное наличие некоторого количества дел ЦАМО и РГАВМФ в пубичном доступе.
Что первое стоит сделать - понять что у нас вообще есть.
Путем несложных махинаций удалось сделать каталог дел из раздела dou ОБД "Память Народа" по состоянию на начало октября 2015 года
72 метра
~3 миллиона документов (большинство в один лист)
https://drive.google.com/file/d/0Bw165TffqAYecklSUUtXeE9hYVE/view?usp=sharing
можно при желании сделать Excel, но мне с текстом в UTF-8 проще
Я попробую подверстать сюда же раздел ЖБД и старый "Подвиг Народа" (его каталог есть тут
www.teatrskazka.com/Raznoe/Fondy_TsAMO/common_list_main.html )
Также надо отладить еще систему мониторинга активности в ОБД - если что новое появится обновлять каталог.
Следуюший шаг видимо на документальной базе ОБД начать строить дерево формирований с учетом всех переводов и переподчинений.
Элементы этой работы в интернете есть
(Справочник
http://samsv.narod.ru/Div/Sd/sd025/default.html
и Википедия на нем нарисованная), но тут просто больше данных.
Потом поднять офицеров. Поднять населенные пункты. Дальше много чего можно сделать. Но нужны энтузиасты по конкретным местностям и армиям. (таких много кстати - даже школьники могут с этой работой справится)
Фактически любой студент на базе документов ОБД сейчас может в узкой области продвинуться дальше чем исследователь долгие годы с энтузиазмом копающий тему.
В частности доступные 50 гигабайт дел по Приморской армии
как минимум удваивают, а то и утраивают знания того же тов. Неменко
http://samlib.ru/n/nemenko_a_w/sostav.shtml
Из недостатков стоит отметить что в Элар не проверяли распознанный контент
со смысловой точки зрения - 59 сп с 54 сп путают постоянно.
(тут и нужна структура формирований по датам)
Ну а дальше можно и на людей и на 58 фонд выйти - по донесениям знать сколько людей было в батальонах и кого из них можно опознать и привязать.
Выйти на уровень американской ГВ. 100 миллионов записей это немного по современным меркам. Кривошеев это конечно хорошо, но реально есть шансы получить уточнения на индивидуальном уровне.
И кстати получить конечную цель ОБД - про каждого знать боевой путь в деталях, знать с кем он служил (хотя увы уже поздно), знать боевые эпизоды
(из 33 фонда поднять).