От iggalp
К дрон1
Дата 30.05.2015 12:44:00
Рубрики Прочее;

Re: память народа.дела...

>а смысл качать они не все страницы выложили.
>как на подвиге народа куски выложат и всё или всё будут выкладывать?

В основном там полные дела выложены. Без первой страницы/обложки. Только иногда попадаются не полные дела. Последняя страница с указанием "В настоящем деле пронумеровано и прошито..." почти всегда присутствует

От капитан
К iggalp (30.05.2015 12:44:00)
Дата 30.05.2015 14:28:47

Re: память народа.дела...

>>а смысл качать они не все страницы выложили.
>>как на подвиге народа куски выложат и всё или всё будут выкладывать?
>
>В основном там полные дела выложены. Без первой страницы/обложки. Только иногда попадаются не полные дела. Последняя страница с указанием "В настоящем деле пронумеровано и прошито..." почти всегда присутствует

У меня показывает только первые сто дел, дальше ни гу-гу. Это у всех так или же как то можно их дальше просматривать.
Подскажите как можно пакетно скачивать дела, я в этом деле дуб, можно и в личку написать.

От Joker0
К капитан (30.05.2015 14:28:47)
Дата 30.05.2015 15:11:46

Re: память народа.дела...

Дела лучше скачивать целиком, т.к. далеко не всегда их содержимое индексируется поиском. Поэтому лучше комбинировать результаты поиска по конкретной части, и по части более высокого подчинения. Хорошо индексируются и находятся документы именно дивизионного уровня. А уж в них можно найти и полковые документы. Поэтому скачивайте папки полностью, тем более что по результатам поиска все равно придется это делать, т.к. ЖБД все же группируются.

Конечная папка в ссылке имеет вид типа "3470-0000001-0431", что широко известным камрадом :), расшифровывается как - фонд 3470, опись 1, дело 431. Внутри самой папки сканы именуются как 00000002.jpg, 00000003.jpg и т.д. (00000000.jpg или 00000001.jpg - не существует). Самые последние страницы (а нередко, что и первые) - это опись содержащихся в папке документов, с указанием отсутствующих листов и приложений. Длина имени в названии файла строго ограничена (8 символов) и они отличаются от соседних на 1. Поэтому достаточно получить любую ссылку на дело, заменить имя скана на 00000002.jpg, и далее меняя ее с шагом на 1 (вручную или с помощью программы), выкачать все дело целиком. А затем уже спокойно просмотреть и разложить по принятой у вас системе хранения информации, не забыв оставить ссылку на исходник.

Лично я для скачивания пользуюсь древней программой Picture Pump, которая сама генерирует имя файла.
Настройки у нее такие -

[295K]



После старта проекта имя файла сменится на - 0000000@.jpg, где @ обозначает генерируемое дополнение к имени. К сожалению, в связи с ограничением в длине имени файла, придется вручную (или я просто не разобрался), после скачки каждых 10 файлов - а) сбрасывать счетчик на 0 , б) менять имя файла с 0000000@.jpg на 0000001@.jpg, 0000002@.jpg и т.д. (для дел на сотни страниц - 0000010@.jpg и т.п., вообщем просто добавляем число десятков вручную, не выходя за пределы формата имени).

Если кто-нибудь разовьет тему и подскажет как это делать еще более удобно, то был бы весьма признателен.




От капитан
К Joker0 (30.05.2015 15:11:46)
Дата 30.05.2015 21:37:38

Re: память народа.дела...

>Дела лучше скачивать целиком, т.к. далеко не всегда их содержимое индексируется поиском. Поэтому лучше комбинировать результаты поиска по конкретной части, и по части более высокого подчинения. Хорошо индексируются и находятся документы именно дивизионного уровня. А уж в них можно найти и полковые документы. Поэтому скачивайте папки полностью, тем более что по результатам поиска все равно придется это делать, т.к. ЖБД все же группируются.

>Конечная папка в ссылке имеет вид типа "3470-0000001-0431", что широко известным камрадом :), расшифровывается как - фонд 3470, опись 1, дело 431. Внутри самой папки сканы именуются как 00000002.jpg, 00000003.jpg и т.д. (00000000.jpg или 00000001.jpg - не существует). Самые последние страницы (а нередко, что и первые) - это опись содержащихся в папке документов, с указанием отсутствующих листов и приложений. Длина имени в названии файла строго ограничена (8 символов) и они отличаются от соседних на 1. Поэтому достаточно получить любую ссылку на дело, заменить имя скана на 00000002.jpg, и далее меняя ее с шагом на 1 (вручную или с помощью программы), выкачать все дело целиком. А затем уже спокойно просмотреть и разложить по принятой у вас системе хранения информации, не забыв оставить ссылку на исходник.

>Лично я для скачивания пользуюсь древней программой Picture Pump, которая сама генерирует имя файла.
>Настройки у нее такие -
>[295K]


>После старта проекта имя файла сменится на - 0000000@.jpg, где @ обозначает генерируемое дополнение к имени. К сожалению, в связи с ограничением в длине имени файла, придется вручную (или я просто не разобрался), после скачки каждых 10 файлов - а) сбрасывать счетчик на 0 , б) менять имя файла с 0000000@.jpg на 0000001@.jpg, 0000002@.jpg и т.д. (для дел на сотни страниц - 0000010@.jpg и т.п., вообщем просто добавляем число десятков вручную, не выходя за пределы формата имени).

>Если кто-нибудь разовьет тему и подскажет как это делать еще более удобно, то был бы весьма признателен.

спасибо!


От Сергей Лотарев
К Joker0 (30.05.2015 15:11:46)
Дата 30.05.2015 19:14:00

Re: память народа.дела...

>После старта проекта имя файла сменится на - 0000000@.jpg, где @ обозначает генерируемое дополнение к имени. К сожалению, в связи с ограничением в длине имени файла, придется вручную (или я просто не разобрался), после скачки каждых 10 файлов - а) сбрасывать счетчик на 0 , б) менять имя файла с 0000000@.jpg на 0000001@.jpg, 0000002@.jpg и т.д. (для дел на сотни страниц - 0000010@.jpg и т.п., вообщем просто добавляем число десятков вручную, не выходя за пределы формата имени).

А не выходит у вас задать имя файла в виде 00000@@@.jpg, где @@@ уже изменяется от 001 до скольких нужно?
Я пакетными закачками лет десять не занимался, но тогда в программах типа GetRight это так и работало.


С уважением, Сергей

От Joker0
К Сергей Лотарев (30.05.2015 19:14:00)
Дата 30.05.2015 19:43:33

Re: память народа.дела...


>А не выходит у вас задать имя файла в виде 00000@@@.jpg, где @@@ уже изменяется от 001 до скольких нужно?
>Я пакетными закачками лет десять не занимался, но тогда в программах типа GetRight это так и работало.

Проверил, не работает. Программа подставляет под символ замены текущий счетчик и тогда получаются ссылки вида 00000011.jpg, 00000022.jpg и т.п.

От cоast70
К Joker0 (30.05.2015 19:43:33)
Дата 30.05.2015 19:54:04

изучайте Download Master ;) (-)


От Joker0
К cоast70 (30.05.2015 19:54:04)
Дата 30.05.2015 21:24:28

Re: изучайте Download...

Помню, была у него подобная штука, только снес его давным-давно. Уж больно часто он обновляться лез. Попробую и его, возможно что и подойдет.

От cоast70
К cоast70 (30.05.2015 19:54:04)
Дата 30.05.2015 20:25:40

мануал на него в копилке ;) (-)