wget скачать сайт целиком
ТуторыКонсольная команда для скачивания сайта:
wget -r -k -l 7 -p -E -nc -U YandexBot http://domain.com
Используемые параметры для скачивания сайта целиком:
-r — рекурсивное скачивание страниц сайта
-k — преобразовывать ссылки в html коде для локального просмотра сайта
-p — скачивать все файлы используемые при отображении страниц сайта - картинки/стили/скрипты и т.д.
-l — уровень вложенности страниц, насколько wget далеко будет парсить
-E — добавлять к скачанным страницам .html
-nc — при использовании этого параметра, скачанные до этого файлы не будут перезаписаны. используется если вам нужно докачать сайт
-U — задать юзерагент, часто на сайтах запрещается доступ для wget, таким образом мы обходим этот запрет
-k — преобразовывать ссылки в html коде для локального просмотра сайта
-p — скачивать все файлы используемые при отображении страниц сайта - картинки/стили/скрипты и т.д.
-l — уровень вложенности страниц, насколько wget далеко будет парсить
-E — добавлять к скачанным страницам .html
-nc — при использовании этого параметра, скачанные до этого файлы не будут перезаписаны. используется если вам нужно докачать сайт
-U — задать юзерагент, часто на сайтах запрещается доступ для wget, таким образом мы обходим этот запрет
Если совсем убрать -l то будет скачана только одна страница
Прочая информация по wget в консоли:
man wget
или
wget --help
Комментарии
Anatolt
13.04.2015 00:55:01
13.04.2015 00:55:01
И натравливаем его на гугл
admin
13.04.2015 01:06:34
13.04.2015 01:06:34
Не очень затея
Anatolt
13.04.2015 02:01:15
13.04.2015 02:01:15
На самом деле ничего страшного
wget -r -k -l 7 -p -E -nc google.com
скачал 32Кб
wget -r -k -l 7 -p -E -nc google.com
скачал 32Кб
admin
13.04.2015 02:08:08
13.04.2015 02:08:08
Ну так на www.youtube.com натрави его, че уж тут
Bot
20.04.2016 21:12:47
20.04.2016 21:12:47
Я РОБОТ!!!!!
admin
21.04.2016 02:50:51
21.04.2016 02:50:51
:D
noname
30.04.2019 09:23:10
30.04.2019 09:23:10
123
Янеробот
15.08.2019 22:55:14
15.08.2019 22:55:14
Чтобы скачать одну страницу, надо еще убрать -r
h
31.10.2022 15:05:39
31.10.2022 15:05:39
<>
k
31.10.2022 15:05:58
31.10.2022 15:05:58
<script>alert(1)</script>
Александр
12.01.2023 13:11:22
12.01.2023 13:11:22
Привет admin! Подскажи пожалуйста, почему при выкачивании всей иерархии сайта при открытии index.html все картинки съезжают вертикально и вся структура рушится? ЧЯДНТ? Ломаются CSS стили страниц при указании путей из index.html?
Спасибо
Спасибо