вычислить какое дело нужно и прокачать
документы они не сами по себе они в делах
дела по героям отдельно а так пачки фронтовых по 900+ листов
листа 2-3 на человека
я подозреваю что дело именно в их промежуточной базе
- насканировали они достаточно дел, но не проиндексировали и не
порезали на кусочки (кстати не факт что это полезно - работа жуткая а пользы 0 - мне проще взять все листы на человека и самому распознать чем
иметь отдельные картинки на части этих листов)
еще одна причина - много народу миррорит сайт средствами малой автоматизации - защищаются как могут