danuvius: (Default)
danuvius ([personal profile] danuvius) wrote2021-01-18 04:23 pm

Книги с сайта Ин-та славяноведения

Коллекция сильно пополнилась за последние годы, вот список книг: https://inslav.ru/resursy-po-alfavitu?title=&items_per_page=All
Задолбался скачивать по одной книге (серии легко скачиваются Данлоуд-мастером), дошел лишь до половины ;((. Копиры сайтов не берут по URL адресам - выдают ошибку. Может, кто знает, как выкачивать автоматом подобные подборки целиком?

Nota. Для памяти. При ошибках о просроченном сертификате перейти на новое приватное окно (в Файерфоксе - справа вверху при нажатии на 3 линии всплывает маска), ввести снова ссылку, отключить антивирус.
(deleted comment)

[identity profile] danuvius.livejournal.com 2021-01-18 02:00 pm (UTC)(link)
Пож., напишите сами на Азбуку.

[identity profile] theophrastis.livejournal.com 2021-01-18 03:23 pm (UTC)(link)
Прошел все круги ада в в виде всех этих регистраций

[identity profile] danuvius.livejournal.com 2021-01-18 03:31 pm (UTC)(link)
Пишите им на почту, где-то должен быть адрес обратной связи. И заодно про свои круги напишите им - они обычно стараются устранить проблемы (я им помог так с недостоверным сертификатом ;)

[identity profile] theophrastis.livejournal.com 2021-01-19 11:16 am (UTC)(link)
И ещё один момент. Ваши ранние публикации для меня просто откровение. Прошу Вас открыть для меня доступ к закрытым публикациям. Обязуюсь без Вашего благословения их не публиковать.
Edited 2021-01-19 11:17 (UTC)

[identity profile] danuvius.livejournal.com 2021-01-19 12:11 pm (UTC)(link)
Я не понял - Вы про что именно? Про ранние записи в ЖЖ - то есть добавить Вас в друзья? Но я уже давно пишу все публично. Уточните, пож., что Вы хотите.

[identity profile] theophrastis.livejournal.com 2021-01-20 01:31 am (UTC)(link)
Да, прошу добавить в друзья. Интересны именно ранние публикации.

[identity profile] danuvius.livejournal.com 2021-01-20 09:38 am (UTC)(link)
Добавил.

[identity profile] ereignis.livejournal.com 2021-01-18 10:37 pm (UTC)(link)
Большинство сайтов можно выкачать со всем содержимым, но нужна хорошая прога с кучей настроек, бесплатные вряд ли справятся.
Я лично привык пользоваться Offline Explorer Enterprise (есть русская версия, с ней проще работать).
В ней сложно разобраться, но оно того стоит, ее возможности (почти) безграничны, если ее изучить.
Например, этот сайт скачать с ее помощью довольно просто:
1. Создать новый проект.
2. В свойствах проекта: 1) во вкладке адрес - адрес из поста; 2) во вкладке уровень - 2 (это количество переходов от ссылки из поста до ссылки на пдф для этого сайта. уровень можно ставить любой, это зависит от сайта, но если поставить слишком большой, скачивание может стать бесконечным, так как прога будет открывать все новые и новые ссылки в разные стороны. в этом случае можно например запретить в настройках выход за пределы исходного домена и т. п.); 3) во вкладке "фильтры файлов" снять галочки со всего кроме "архивы" и внутри этой группы "pdf". Если нужны не только пдф, а все страницы сайта, галочки можно не снимать; 4) вкладка "папка загрузки" - указать папку. в ней будет складываться все скачиваемое в соответствии со структурой сайта, т. е. подпапки будут соответствовать /../../ в адресе. Для этого сайта больше ничего в настройках проекта можно не трогать. После запуска проекта прога сперва пройдется по всем ссылкам 1-го уровня без скачки (т. е. по html страницам с описаниями книг), а затем перейдет на 2-й уровень (ссылки со страниц книг на файлы пдф). Думаю, при хорошем инете весь сайт выкачается за час-два, если не быстрее.

[identity profile] danuvius.livejournal.com 2021-01-18 10:40 pm (UTC)(link)
Я все так и делал, только с бесплатными версиями двух программ (все очень похоже). Попробую еще раз.

[identity profile] ereignis.livejournal.com 2021-01-18 10:45 pm (UTC)(link)
Многое зависит от того, как именно программа взаимодействует с сайтом, может чего-то где-то не хватать и будут сбои.
Свой "рецепт" я только что проверил, так что эта программа по этому алгоритму с этим сайтом точно работает :)

[identity profile] danuvius.livejournal.com 2021-01-18 11:18 pm (UTC)(link)
Еще раз попробовал по этой программе, указав адрес https://inslav.ru/publication
По-прежнему ноль скачанных пдфов, хотя все делал, как Вы написали.
Прога на 30 дней бесплатно.
Не понимаю, где у меня ошибка.

[identity profile] danuvius.livejournal.com 2021-01-18 11:35 pm (UTC)(link)
Все равно не хочет.

[identity profile] ereignis.livejournal.com 2021-01-18 11:50 pm (UTC)(link)
Что значит не хочет?
Внизу общего окна программы должно быть горизонтальное окно "Состояние загрузки", если его нет - можно нажать вкладку Вид и включить его. Там наверху этого нижнего окна после запуска закачки проекта появляются надписи - загружено XX файлов ... очередь YY файлов. Если цифры растут в "загружено" и меняются в "очередь" - значит процесс идет. Нужно только дождаться когда дойдет очередь до пдф, это не сразу, потому что сперва грузятся (без записи в папку) страницы html. А если цифры не меняются, значит ошибка где-то в настройках проекта, нужно пересоздать его еще раз в точности по инструкции выше.

[identity profile] danuvius.livejournal.com 2021-01-18 11:53 pm (UTC)(link)
Я все это понимаю, но проект заканчивается минимально (без нужных мне файлов) и потом все. Перезапуски и перемены настроек не помогают.
Я удалил все проекты и пробую сейчас создать копию всего сайта только по архивам - посмотрю, что получится.
Edited 2021-01-18 23:54 (UTC)

[identity profile] ereignis.livejournal.com 2021-01-19 12:00 am (UTC)(link)
Самое главное - это правильный начальный веб-адрес и правильный уровень.
Проект - Свойства:
Во вкладке адрес должно быть: https://inslav.ru/resursy-po-alfavitu?title=&items_per_page=All
Во вкладке уровень - стоять галочка и цифра 2.
Даже если в проекте вообще больше ничего не трогать кроме этих двух пунктов, пдф должны скачаться, просто еще скачаются и все прочие файлы с сайта.

[identity profile] danuvius.livejournal.com 2021-01-19 12:04 am (UTC)(link)
Все так и было - и все равно ноль.
Я ведь раньше работал с такими прогами, так что немного понимаю, как они действуют. Но вот теперь почему-то не качают так, как у Вас.
Однако загрузка всего сайта идет, причем именно пдфы (я только "архивы" качать поставил). В Публикациях пока прога дает только названия файлов, но не пдфы.

[identity profile] ereignis.livejournal.com 2021-01-19 12:25 am (UTC)(link)
"В Публикациях пока прога дает только названия файлов, но не пдфы"

Это правильно, эта программа действует в точности как человек - сперва открывает (= загружает) страницу книги (всех по очереди), дальше ищет ссылку на пдф и добавляет ее в очередь, потом по очереди грузит пдф, складывая их в папки по их адресам (https@inslav.ru\images\stories\pdf и др.). Сколько кликов мышкой нужно человеку чтобы добраться с исходной страницы до пдф, столько нужно написать в поле "уровень" программе.

Еще раз самая простая схема, которая ТОЧНО работает:
1) нажать новый проект (название любое);
2) Вкладка "Адрес": вставить "https://inslav.ru/resursy-po-alfavitu?title=&items_per_page=All" в поле "Начальный веб-адрес";
3) Вкладка "Уровень": уровень - галочка, ограничение уровня - 2.
4) Вкладка "Папка загрузки": разрешить - галочка + путь к папке куда складывать файлы.
Больше не нужно трогать ничего, нажать ок, нажать загрузить проект и ждать загрузки.

Другие варианты тоже могут работать, главное правильно задать начальную страницу и уровень. Так что после нескольких попыток все должно получиться.

[identity profile] danuvius.livejournal.com 2021-01-19 12:38 am (UTC)(link)
Я установил версию 5.9, в ней папка загрузки (путь) выбирается не в ходе создания проекта, а заранее.
Ваш алгоритм я пробовал многажды - не работает. Может, происходит какая-то накладка при несовпадении точного адреса, указанного в задании, и адреса https@inslav.ru\images\stories\ ? А вот сейчас, когда я задал копировать весь сайт, все получается, и пдфы складируются там, где Вы указали. Спасибо! Даже таким макаром - громадное облегчение.

Если у Вас остался крякнутый дистрибутив, не могли бы Вы мне прислать его? Я скачал один, но генератор паролей не срабатывает (дает неподходящий ключ; отключать Касперского боюсь при работе с прогами из инета). Или откуда взять надежный? Не хочется переустанавливать каждый раз (бесплатно на месяц дают).

[identity profile] ereignis.livejournal.com 2021-01-19 12:47 am (UTC)(link)
У себя сейчас не найду, ставил очень давно.
Брать все взломанное советую только на ру-борде (нужна регистрация, но это быстро), там все всегда надежно и без вирусов, можно при необходимости и антивирусы на время установки отключать спокойно.
Вот тема по этой проге, в конце есть ссылки на актуальные комплекты (у меня стоит версия 7.7).
http://forum.ru-board.com/topic.cgi?forum=35&topic=43825&start=900

[identity profile] danuvius.livejournal.com 2021-01-18 11:39 pm (UTC)(link)
Может, я какую-то не ту версию установил. Откуда лучше взять и чтобы без вирусов? Пусть без кряка - убедиться, что работает.

[identity profile] danuvius.livejournal.com 2021-01-19 03:15 am (UTC)(link)
Спс! Оказалось, я сначала установил глючную старую программу. Установил новую версию (7.7) - и качать стала в разы быстрее, и глюки исчезли (прежняя зависала, не хотела иногда качать пдфы и проч.).

С указанного Вами сайта что-то Касперский не дал открыть, но я нашел среди списка прогу с патчем, все сработало (с на всякий случай отключенной антивир. защитой во время кряка).