От apple16 Ответить на сообщение
К iggalp Ответить по почте
Дата 14.02.2018 01:17:58 Найти в дереве
Рубрики Прочее; WWII; 1941; Версия для печати

Дежавю - зло. Хочешь сэкономить место - распознай текст ))

Цель именно такая - пыльный архив не нужен - у него только функция хранения.

Функция распространения полностью уехала в интернет.
Все доступно в максимальном качестве и доступно всем
Именно так сделана Библиотека Конгресса много лет назад - хочешь превьюшку, хочешь максимальный размер чтобы сразу на билборд зашарить.
Совсем не сложно сделать UI который всех устроит.

Это азы работы с информацией - нельзя принимать решения о безвозвратной ее утрате. Нет людей для этого компетентных. Никто не знает, какое будет использование - может пятна грязи на обложке будут важным элементом данных.

Нужно тупо строить эдектронное ЦАМО, где можно скачать PDF дела целиком в читаемом качестве со слоем распознанного текста, где можно. А можно качнуть PDF под печать. И полнотекстовый поиск. Это вообще сделать можно было вчера. Есть куча проектов 10-15 летней давности с этим. (тот же архив Таймс например)
И главное никаких дурацких посредников ))


Дальше поднимать из дел людей, географию и части/соединения. Чтобы по человеку все его упоминания, по локации все карты и тп. Это тоже не сложно, просто трудоемко.
+ Обратная связь нормальная - сервис деск дабы оперативно чинить проблемы.
(я знаю вагон битых карт навроде 213-0002002-1018 и всем пофиг, 1941 с 1944 в индексах попутано в сотне мест)
+ Контроль подлинности оригинала - с базой печатей, штампов и подписей можно валять очень правдоподобные фальшивки

Посканить бумажки это первый этап. А вот дальще что-то пошло не так - занялись непоятной деятельностью.