|
От
|
apple16
|
|
К
|
iggalp
|
|
Дата
|
14.02.2018 01:17:58
|
|
Рубрики
|
Прочее; WWII; 1941;
|
|
Дежавю - зло. Хочешь сэкономить место - распознай текст ))
Цель именно такая - пыльный архив не нужен - у него только функция хранения.
Функция распространения полностью уехала в интернет.
Все доступно в максимальном качестве и доступно всем
Именно так сделана Библиотека Конгресса много лет назад - хочешь превьюшку, хочешь максимальный размер чтобы сразу на билборд зашарить.
Совсем не сложно сделать UI который всех устроит.
Это азы работы с информацией - нельзя принимать решения о безвозвратной ее утрате. Нет людей для этого компетентных. Никто не знает, какое будет использование - может пятна грязи на обложке будут важным элементом данных.
Нужно тупо строить эдектронное ЦАМО, где можно скачать PDF дела целиком в читаемом качестве со слоем распознанного текста, где можно. А можно качнуть PDF под печать. И полнотекстовый поиск. Это вообще сделать можно было вчера. Есть куча проектов 10-15 летней давности с этим. (тот же архив Таймс например)
И главное никаких дурацких посредников ))
Дальше поднимать из дел людей, географию и части/соединения. Чтобы по человеку все его упоминания, по локации все карты и тп. Это тоже не сложно, просто трудоемко.
+ Обратная связь нормальная - сервис деск дабы оперативно чинить проблемы.
(я знаю вагон битых карт навроде 213-0002002-1018 и всем пофиг, 1941 с 1944 в индексах попутано в сотне мест)
+ Контроль подлинности оригинала - с базой печатей, штампов и подписей можно валять очень правдоподобные фальшивки
Посканить бумажки это первый этап. А вот дальще что-то пошло не так - занялись непоятной деятельностью.