От iggalp
К apple16
Дата 13.02.2018 14:25:22
Рубрики Прочее; WWII; 1941;

Re: Спасибо, но...

>Это реально надо, просто потому что их периодически печатают в натуральный размер и смотрят на них через увеличительное стекло. Артефактов быть не должно

Это в некотором смысле для староверов. Можно конечно быть перфектционистом, но если наличие артефактов не драматично искажает доносимую информацию, то это вполне себе нормально. Это во-первых. Во-вторых, электронный файл в сети не предназначен для вывода на печать в натуральный размер с полиграфическим качеством.

>Примитивное знание - если информацию из-каких-нибудь соображений потерять, то потом ее уже не восстановить. Отсюда TIFF конских размеров в LoC.

Это понятно. Но вот если у вас есть обычная страница текста, то jpg в 300 dpi в сером цвете (не цветном) более чем достаточно. Даже с запасом. А можно конечно и 1200дпи без сжатия готовить конских размеров. Только для чего? Чтобы в увеличении в 800% завиток на тегеле не искажался?

>ЭЛАР сделал сканы неплохо и первой версией я был вполне удовлетворен.
>Байтов нам не жалко (и терабайтов тоже) - лучше тут перегнуть палку, чем потом оказаться дураками. Диск на 2 терабайта стоит меньше месячной зарплаты кого угодно. Экономить место это идиотизм.

Не жалко для локального хранения в целях замены подлинника по-максимуму непосредственно в архиве. Для целей выкладки в сети это пока еще сильный перебор.

>А вот дальше началась игра с намеренной порчей информации (водяные знаки)
>А чо такого - нам на пользователей насрать - мы не ощущаем себя сервисом.

>Но поскольку в РФ в таких конторах традиционно платят мало исполнители оказались низкого качества - размер испорченных файлов был в разы больше чем оригинальных.
>Качество картинки осталось норм - без артефактов. Но представители меньшинств не унимались - как результат в 2017 году испорченные карты стали с артефактами.
>Размер в байтах да, поменьше. Но печатать это уже нельзя.

А это как раз возможно следствие пренебрежения к затрачиваемым объемам хранителей. Не жалко. Поэтому и культура работы с электронными картинками во многом испарилась. В прежние времена люди гораздо трепетнее относились к соотношению качество\размер. Вникали в нюансы форматов и тп. А сейчас пофиг. Лепят уродливые книги-дежавю, практически безнадежно уничтожая исходный материал. А в свое время дежавю был большим прорывом, но по месту и по цели.


От apple16
К iggalp (13.02.2018 14:25:22)
Дата 14.02.2018 01:17:58

Дежавю - зло. Хочешь сэкономить место - распознай текст ))

Цель именно такая - пыльный архив не нужен - у него только функция хранения.

Функция распространения полностью уехала в интернет.
Все доступно в максимальном качестве и доступно всем
Именно так сделана Библиотека Конгресса много лет назад - хочешь превьюшку, хочешь максимальный размер чтобы сразу на билборд зашарить.
Совсем не сложно сделать UI который всех устроит.

Это азы работы с информацией - нельзя принимать решения о безвозвратной ее утрате. Нет людей для этого компетентных. Никто не знает, какое будет использование - может пятна грязи на обложке будут важным элементом данных.

Нужно тупо строить эдектронное ЦАМО, где можно скачать PDF дела целиком в читаемом качестве со слоем распознанного текста, где можно. А можно качнуть PDF под печать. И полнотекстовый поиск. Это вообще сделать можно было вчера. Есть куча проектов 10-15 летней давности с этим. (тот же архив Таймс например)
И главное никаких дурацких посредников ))


Дальше поднимать из дел людей, географию и части/соединения. Чтобы по человеку все его упоминания, по локации все карты и тп. Это тоже не сложно, просто трудоемко.
+ Обратная связь нормальная - сервис деск дабы оперативно чинить проблемы.
(я знаю вагон битых карт навроде 213-0002002-1018 и всем пофиг, 1941 с 1944 в индексах попутано в сотне мест)
+ Контроль подлинности оригинала - с базой печатей, штампов и подписей можно валять очень правдоподобные фальшивки

Посканить бумажки это первый этап. А вот дальще что-то пошло не так - занялись непоятной деятельностью.