От
|
капитан
|
К
|
Joker0
|
Дата
|
30.05.2015 21:37:38
|
Рубрики
|
Прочее;
|
Re: память народа.дела...
>Дела лучше скачивать целиком, т.к. далеко не всегда их содержимое индексируется поиском. Поэтому лучше комбинировать результаты поиска по конкретной части, и по части более высокого подчинения. Хорошо индексируются и находятся документы именно дивизионного уровня. А уж в них можно найти и полковые документы. Поэтому скачивайте папки полностью, тем более что по результатам поиска все равно придется это делать, т.к. ЖБД все же группируются.
>Конечная папка в ссылке имеет вид типа "3470-0000001-0431", что широко известным камрадом :), расшифровывается как - фонд 3470, опись 1, дело 431. Внутри самой папки сканы именуются как 00000002.jpg, 00000003.jpg и т.д. (00000000.jpg или 00000001.jpg - не существует). Самые последние страницы (а нередко, что и первые) - это опись содержащихся в папке документов, с указанием отсутствующих листов и приложений. Длина имени в названии файла строго ограничена (8 символов) и они отличаются от соседних на 1. Поэтому достаточно получить любую ссылку на дело, заменить имя скана на 00000002.jpg, и далее меняя ее с шагом на 1 (вручную или с помощью программы), выкачать все дело целиком. А затем уже спокойно просмотреть и разложить по принятой у вас системе хранения информации, не забыв оставить ссылку на исходник.
>Лично я для скачивания пользуюсь древней программой Picture Pump, которая сама генерирует имя файла.
>Настройки у нее такие -
>[295K]
>После старта проекта имя файла сменится на - 0000000@.jpg, где @ обозначает генерируемое дополнение к имени. К сожалению, в связи с ограничением в длине имени файла, придется вручную (или я просто не разобрался), после скачки каждых 10 файлов - а) сбрасывать счетчик на 0 , б) менять имя файла с 0000000@.jpg на 0000001@.jpg, 0000002@.jpg и т.д. (для дел на сотни страниц - 0000010@.jpg и т.п., вообщем просто добавляем число десятков вручную, не выходя за пределы формата имени).
>Если кто-нибудь разовьет тему и подскажет как это делать еще более удобно, то был бы весьма признателен.
спасибо!