Книги с сайта Ин-та славяноведения
Jan. 18th, 2021 04:23 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Коллекция сильно пополнилась за последние годы, вот список книг: https://inslav.ru/resursy-po-alfavitu?title=&items_per_page=All
Задолбался скачивать по одной книге (серии легко скачиваются Данлоуд-мастером), дошел лишь до половины ;((. Копиры сайтов не берут по URL адресам - выдают ошибку. Может, кто знает, как выкачивать автоматом подобные подборки целиком?
Nota. Для памяти. При ошибках о просроченном сертификате перейти на новое приватное окно (в Файерфоксе - справа вверху при нажатии на 3 линии всплывает маска), ввести снова ссылку, отключить антивирус.
Задолбался скачивать по одной книге (серии легко скачиваются Данлоуд-мастером), дошел лишь до половины ;((. Копиры сайтов не берут по URL адресам - выдают ошибку. Может, кто знает, как выкачивать автоматом подобные подборки целиком?
Nota. Для памяти. При ошибках о просроченном сертификате перейти на новое приватное окно (в Файерфоксе - справа вверху при нажатии на 3 линии всплывает маска), ввести снова ссылку, отключить антивирус.
no subject
Date: 2021-01-18 11:35 pm (UTC)no subject
Date: 2021-01-18 11:50 pm (UTC)Внизу общего окна программы должно быть горизонтальное окно "Состояние загрузки", если его нет - можно нажать вкладку Вид и включить его. Там наверху этого нижнего окна после запуска закачки проекта появляются надписи - загружено XX файлов ... очередь YY файлов. Если цифры растут в "загружено" и меняются в "очередь" - значит процесс идет. Нужно только дождаться когда дойдет очередь до пдф, это не сразу, потому что сперва грузятся (без записи в папку) страницы html. А если цифры не меняются, значит ошибка где-то в настройках проекта, нужно пересоздать его еще раз в точности по инструкции выше.
no subject
Date: 2021-01-18 11:53 pm (UTC)Я удалил все проекты и пробую сейчас создать копию всего сайта только по архивам - посмотрю, что получится.
no subject
Date: 2021-01-19 12:00 am (UTC)Проект - Свойства:
Во вкладке адрес должно быть: https://inslav.ru/resursy-po-alfavitu?title=&items_per_page=All
Во вкладке уровень - стоять галочка и цифра 2.
Даже если в проекте вообще больше ничего не трогать кроме этих двух пунктов, пдф должны скачаться, просто еще скачаются и все прочие файлы с сайта.
no subject
Date: 2021-01-19 12:04 am (UTC)Я ведь раньше работал с такими прогами, так что немного понимаю, как они действуют. Но вот теперь почему-то не качают так, как у Вас.
Однако загрузка всего сайта идет, причем именно пдфы (я только "архивы" качать поставил). В Публикациях пока прога дает только названия файлов, но не пдфы.
no subject
Date: 2021-01-19 12:25 am (UTC)Это правильно, эта программа действует в точности как человек - сперва открывает (= загружает) страницу книги (всех по очереди), дальше ищет ссылку на пдф и добавляет ее в очередь, потом по очереди грузит пдф, складывая их в папки по их адресам (https@inslav.ru\images\stories\pdf и др.). Сколько кликов мышкой нужно человеку чтобы добраться с исходной страницы до пдф, столько нужно написать в поле "уровень" программе.
Еще раз самая простая схема, которая ТОЧНО работает:
1) нажать новый проект (название любое);
2) Вкладка "Адрес": вставить "https://inslav.ru/resursy-po-alfavitu?title=&items_per_page=All" в поле "Начальный веб-адрес";
3) Вкладка "Уровень": уровень - галочка, ограничение уровня - 2.
4) Вкладка "Папка загрузки": разрешить - галочка + путь к папке куда складывать файлы.
Больше не нужно трогать ничего, нажать ок, нажать загрузить проект и ждать загрузки.
Другие варианты тоже могут работать, главное правильно задать начальную страницу и уровень. Так что после нескольких попыток все должно получиться.
no subject
Date: 2021-01-19 12:38 am (UTC)Ваш алгоритм я пробовал многажды - не работает. Может, происходит какая-то накладка при несовпадении точного адреса, указанного в задании, и адреса https@inslav.ru\images\stories\ ? А вот сейчас, когда я задал копировать весь сайт, все получается, и пдфы складируются там, где Вы указали. Спасибо! Даже таким макаром - громадное облегчение.
Если у Вас остался крякнутый дистрибутив, не могли бы Вы мне прислать его? Я скачал один, но генератор паролей не срабатывает (дает неподходящий ключ; отключать Касперского боюсь при работе с прогами из инета). Или откуда взять надежный? Не хочется переустанавливать каждый раз (бесплатно на месяц дают).
no subject
Date: 2021-01-19 12:47 am (UTC)Брать все взломанное советую только на ру-борде (нужна регистрация, но это быстро), там все всегда надежно и без вирусов, можно при необходимости и антивирусы на время установки отключать спокойно.
Вот тема по этой проге, в конце есть ссылки на актуальные комплекты (у меня стоит версия 7.7).
http://forum.ru-board.com/topic.cgi?forum=35&topic=43825&start=900