От apple16
К panzeralex
Дата 21.12.2016 07:02:18
Рубрики WWII; Танки; Армия;

ЦАМО не существует, потому что его нет в интернете ))

В ОБД попало хорошо если по одной описи из фонда, но зато их можно
каждому руками пощупать. Это чудовищный бонус - ксероксы и тетрадочки с карандашиками идут лесом.

ОБД состоит из двух частей
1. Массива сканов документов
2. Попыток построить поверх этого некую "базу документов"

Первая часть сделана на твердую 4 (если не считать идиотизма с "водяными знаками" и неудачно выбранный режим сжатия JPEG страниц)
Сканы индексируются аналогично ЦАМО, только вместо листов идут страницы
(что логично - обратная сторона листа это отдельный документ)
Проблем тут не вижу - дело в целом называется точно так же.
Неизвестно зачем убрали из публичного доступа обложки дел, но в принципе это пережить можно.

На сегодняшний день не зарегистрировано откровенных подделок документов в ОБД,
хотя простор для этого есть - контрольных сумм на документы они не считают и не публикуют. Другое дело что все более или менее интересное уже скачано и они не знают, что конкретно вылезет. Поэтому в случае проблем документ просто уберут, а не будут подделывать. Публичной описи имущества ведь все равно нет.
Таким образом ОБД это четко подмножество ЦАМО (ну с разными РГАВМФ что не суть важно). Тут все честно.


А вот все игры ОБД с тем, что у них не куча сканов дел а база документов это идиотизм чистой воды. Документы в деле связаны друг с другом и их надо смотреть подряд. Поштучно находить и читать не работает. Там очень все плохо с пониманием кто и зачем будет шерстить эту базу.
Фактически продуман был один случай - родственник раз в году в начале мая пару часов пошарится в поисках.

Есть также проблемы понимания своей роли в процессе у разной обслуги как в погонах так и без - задачу поставили отсканировать и отдать. Но продолжают цепляться за документы, как будто они им принадлежат.
Нормального взаимодействия с общественностью к сожалению не получилось
- после первого же "хватать и не пущать" и прочих понтов с позиции силы
нет никакого желания общаться. Могли бы организовать сбор данных, нарисовать нормальные пользовательские истории. Поняли бы, что нужно сделать. Никто бы не стал в пожарном порядке отбирать дела у ОБД, если бы было удобно пользоваться и были гарантии, что завтра что-нибудь необратимо не улучшат.
"Мемориал" вот отбили от идиотов и никто его не зеркалит ночами в кубышку.
Все знают, что он на месте и все там есть. Библиотека Конгресса США опять таки вот совершенно не переживает если ее материалы скачивают. Увы - много еще в казенном секторе зашуганных людей работает, без образования и опыта.

__________________


В общем, если не сложно, давайте ЦАМО-шные ссылки фонд-опись-дело
С помощью тулзы на
https://vnr.github.io/pamyat-naroda-search/
они легко превращаются в прямые ссылки в ОБД
- школота с танчиками полезет знать больше.

От Иван Уфимцев
К apple16 (21.12.2016 07:02:18)
Дата 21.12.2016 15:44:02

Re: ЦАМО не...

On 21.12.2016 06:02, apple16 wrote:
> Фактически продуман был один случай - родственник раз в году в начале мая пару часов пошарится в поисках.

и толком ничего не найдёт. После чего плюнет на эту дурную ИБД.

Возьмём, к примеру, меня.

Одного родственника с большим трудом нашёл. Оказалось, там "просто всралась очепятка"(тм) в годе рождения.

Но. По найденному поднять боевой путь части и смежные (за что награждали "по бумагам" и на самом деле) события -- мягко говоря
получается плохо.

По остальным не нашёл ничего. Так и живём.

--
CU, IVan.

От apple16
К Иван Уфимцев (21.12.2016 15:44:02)
Дата 21.12.2016 21:24:19

Там есть несколько технологий конечно

В основном плавающий поиск - заранее решить, что может быть неправдой в базе
(а может все)

Но всяким Кузнецовым и Ивановым труба - фиг кого найдешь ибо много

По-норамльному нужно связи строить людей с формированиями, населенными пунктами и тп и искать с учетом связей

Типа все однополчане вот этого человека.
Данные для этого все есть.
Нет постановки задач.

Вторая проблема это ошибки в данных - их нужно выявлять и чинить.
Сколько левых дивизий и полков как в медицинских донесениях вы нигде не найдете.
Но в ОБД не смогли обеспечить унификацию даже имен файлов (где JPG а где и jpg или вот tif недавно видел) Где тут о качестве данных говорить.




От Иван Уфимцев
К apple16 (21.12.2016 21:24:19)
Дата 21.12.2016 23:21:17

Спасибо, буду пробовать в новый подход к снаряду.

On 21.12.2016 20:24, apple16 wrote:
> В основном плавающий поиск - заранее решить, что может быть неправдой в базе
> (а может все)

Сабж.
Например, год рождения и/или звание.

> Но всяким Кузнецовым и Ивановым труба - фиг кого найдешь ибо много

Воот. Добавляем сюда сложности с мнээ наложением фильтров и получаем практически полную антигуманность невозможность
пользоваться для слабоподготовленного и слабомотивированного пользователя.

> По-норамльному нужно связи строить людей с формированиями, населенными пунктами и тп и искать с учетом связей

Для этого нужно сначала найти нужного человека в базе. Но даже с этим там мнээ не всё просто.
Хотя бы по НП призыва искать можно, и то хорошо.

> Типа все однополчане вот этого человека.

Ну вот, есть у меня например "810 шап 225 шад" или "Последнее место службы 45 сд".

В куда там эти данные дальше вставлять?

> Данные для этого все есть.
> Нет постановки задач.

Чтобы уметь поставить задачу, надо знать половину ответа.
Например, простому пользователю интернета человеку мало что даст знание такой сокровенной информации:

"Название источника информации ЦАМО
Номер фонда источника информации 58
Номер описи источника информации 818883
Номер дела источника информации 180"

> Вторая проблема это ошибки в данных - их нужно выявлять и чинить.
> Сколько левых дивизий и полков как в медицинских донесениях вы нигде не найдете.

Это лечится пресловутой избыточной информацией. Которая там или есть только в картинках, или, хоть и есть в результатах, для
дальнейшего поиска её использовать некуда.

> Но в ОБД не смогли обеспечить унификацию даже имен файлов (где JPG а где и jpg или вот tif недавно видел) Где тут о качестве данных говорить.

Не только и не сколько данных, а удобства и даже возможности формирования поискового запроса.


--
CU, IVan.

От IAM
К apple16 (21.12.2016 07:02:18)
Дата 21.12.2016 10:23:21

Re: ЦАМО не...

>В общем, если не сложно, давайте ЦАМО-шные ссылки фонд-опись-дело

Зачем такие сложности? В статье у panzeralex указано ведь что и откуда взято. Кому надо тот дальше сам найдет.

>С помощью тулзы на
>
https://vnr.github.io/pamyat-naroda-search/

Эту ссылочку еще и знать надо. Её некоторые уважаемые исследователи не знали до недавнего времени.

>они легко превращаются в прямые ссылки в ОБД
>- школота с танчиками полезет знать больше.

Школота с танчиками до списка литературы может статью и не дочитать.

От apple16
К IAM (21.12.2016 10:23:21)
Дата 21.12.2016 21:05:05

Это сложно, а народ нынче ленивый

Копипаст фонд-опись в форму еще осилят, а по названию части уже нет.

От Иван Уфимцев
К apple16 (21.12.2016 21:05:05)
Дата 21.12.2016 23:25:00

Не столько ленивый, сколько неумелый.

On 21.12.2016 20:05, apple16 wrote:
> Re: Это сложно, а народ нынче ленивый Копипаст фонд-опись в форму еще осилят, а по названию части уже нет.

Сабж.
Более того.

Простому человеку "название части" или "номер части" скажут куда больше, чем "фонд-опись-дело-документ".
Простому человеку сначала надо где-то найти методику поиска и понять на "делай-раз, делай-два.." как надо действовать.


--
CU, IVan.