Книги с сайта Ин-та славяноведения
Коллекция сильно пополнилась за последние годы, вот список книг: https://inslav.ru/resursy-po-alfavitu?title=&items_per_page=All
Задолбался скачивать по одной книге (серии легко скачиваются Данлоуд-мастером), дошел лишь до половины ;((. Копиры сайтов не берут по URL адресам - выдают ошибку. Может, кто знает, как выкачивать автоматом подобные подборки целиком?
Nota. Для памяти. При ошибках о просроченном сертификате перейти на новое приватное окно (в Файерфоксе - справа вверху при нажатии на 3 линии всплывает маска), ввести снова ссылку, отключить антивирус.
Задолбался скачивать по одной книге (серии легко скачиваются Данлоуд-мастером), дошел лишь до половины ;((. Копиры сайтов не берут по URL адресам - выдают ошибку. Может, кто знает, как выкачивать автоматом подобные подборки целиком?
Nota. Для памяти. При ошибках о просроченном сертификате перейти на новое приватное окно (в Файерфоксе - справа вверху при нажатии на 3 линии всплывает маска), ввести снова ссылку, отключить антивирус.
no subject
no subject
no subject
no subject
no subject
no subject
no subject
no subject
Я лично привык пользоваться Offline Explorer Enterprise (есть русская версия, с ней проще работать).
В ней сложно разобраться, но оно того стоит, ее возможности (почти) безграничны, если ее изучить.
Например, этот сайт скачать с ее помощью довольно просто:
1. Создать новый проект.
2. В свойствах проекта: 1) во вкладке адрес - адрес из поста; 2) во вкладке уровень - 2 (это количество переходов от ссылки из поста до ссылки на пдф для этого сайта. уровень можно ставить любой, это зависит от сайта, но если поставить слишком большой, скачивание может стать бесконечным, так как прога будет открывать все новые и новые ссылки в разные стороны. в этом случае можно например запретить в настройках выход за пределы исходного домена и т. п.); 3) во вкладке "фильтры файлов" снять галочки со всего кроме "архивы" и внутри этой группы "pdf". Если нужны не только пдф, а все страницы сайта, галочки можно не снимать; 4) вкладка "папка загрузки" - указать папку. в ней будет складываться все скачиваемое в соответствии со структурой сайта, т. е. подпапки будут соответствовать /../../ в адресе. Для этого сайта больше ничего в настройках проекта можно не трогать. После запуска проекта прога сперва пройдется по всем ссылкам 1-го уровня без скачки (т. е. по html страницам с описаниями книг), а затем перейдет на 2-й уровень (ссылки со страниц книг на файлы пдф). Думаю, при хорошем инете весь сайт выкачается за час-два, если не быстрее.
no subject
no subject
Свой "рецепт" я только что проверил, так что эта программа по этому алгоритму с этим сайтом точно работает :)
no subject
По-прежнему ноль скачанных пдфов, хотя все делал, как Вы написали.
Прога на 30 дней бесплатно.
Не понимаю, где у меня ошибка.
no subject
no subject
no subject
Внизу общего окна программы должно быть горизонтальное окно "Состояние загрузки", если его нет - можно нажать вкладку Вид и включить его. Там наверху этого нижнего окна после запуска закачки проекта появляются надписи - загружено XX файлов ... очередь YY файлов. Если цифры растут в "загружено" и меняются в "очередь" - значит процесс идет. Нужно только дождаться когда дойдет очередь до пдф, это не сразу, потому что сперва грузятся (без записи в папку) страницы html. А если цифры не меняются, значит ошибка где-то в настройках проекта, нужно пересоздать его еще раз в точности по инструкции выше.
no subject
Я удалил все проекты и пробую сейчас создать копию всего сайта только по архивам - посмотрю, что получится.
no subject
Проект - Свойства:
Во вкладке адрес должно быть: https://inslav.ru/resursy-po-alfavitu?title=&items_per_page=All
Во вкладке уровень - стоять галочка и цифра 2.
Даже если в проекте вообще больше ничего не трогать кроме этих двух пунктов, пдф должны скачаться, просто еще скачаются и все прочие файлы с сайта.
no subject
Я ведь раньше работал с такими прогами, так что немного понимаю, как они действуют. Но вот теперь почему-то не качают так, как у Вас.
Однако загрузка всего сайта идет, причем именно пдфы (я только "архивы" качать поставил). В Публикациях пока прога дает только названия файлов, но не пдфы.
no subject
Это правильно, эта программа действует в точности как человек - сперва открывает (= загружает) страницу книги (всех по очереди), дальше ищет ссылку на пдф и добавляет ее в очередь, потом по очереди грузит пдф, складывая их в папки по их адресам (https@inslav.ru\images\stories\pdf и др.). Сколько кликов мышкой нужно человеку чтобы добраться с исходной страницы до пдф, столько нужно написать в поле "уровень" программе.
Еще раз самая простая схема, которая ТОЧНО работает:
1) нажать новый проект (название любое);
2) Вкладка "Адрес": вставить "https://inslav.ru/resursy-po-alfavitu?title=&items_per_page=All" в поле "Начальный веб-адрес";
3) Вкладка "Уровень": уровень - галочка, ограничение уровня - 2.
4) Вкладка "Папка загрузки": разрешить - галочка + путь к папке куда складывать файлы.
Больше не нужно трогать ничего, нажать ок, нажать загрузить проект и ждать загрузки.
Другие варианты тоже могут работать, главное правильно задать начальную страницу и уровень. Так что после нескольких попыток все должно получиться.
no subject
Ваш алгоритм я пробовал многажды - не работает. Может, происходит какая-то накладка при несовпадении точного адреса, указанного в задании, и адреса https@inslav.ru\images\stories\ ? А вот сейчас, когда я задал копировать весь сайт, все получается, и пдфы складируются там, где Вы указали. Спасибо! Даже таким макаром - громадное облегчение.
Если у Вас остался крякнутый дистрибутив, не могли бы Вы мне прислать его? Я скачал один, но генератор паролей не срабатывает (дает неподходящий ключ; отключать Касперского боюсь при работе с прогами из инета). Или откуда взять надежный? Не хочется переустанавливать каждый раз (бесплатно на месяц дают).
no subject
Брать все взломанное советую только на ру-борде (нужна регистрация, но это быстро), там все всегда надежно и без вирусов, можно при необходимости и антивирусы на время установки отключать спокойно.
Вот тема по этой проге, в конце есть ссылки на актуальные комплекты (у меня стоит версия 7.7).
http://forum.ru-board.com/topic.cgi?forum=35&topic=43825&start=900
no subject
no subject
С указанного Вами сайта что-то Касперский не дал открыть, но я нашел среди списка прогу с патчем, все сработало (с на всякий случай отключенной антивир. защитой во время кряка).