爬虫

By admin , 7 八月, 2017

下载网页及一层链接:

wget -k -r -l1 <URL>

对网站做镜像，已下载过的网页如果有更新也会重新下载：

wget -m <URL>

下载整个网站，已下载过的网页不再下载（也不检查是否有更新）：

wget -r -l inf --no-remove-listing -nc <URL>

如果想排除一些文件，可以这样：

wget --reject *.zip

评论

您的名字

CAPTCHA

本站使用的软件

请输入"Drupal"

This question is for testing whether or not you are a human visitor and to prevent automated spam submissions.

最新内容

量子力学纲要
2 days 19 hours ago
布洛赫球
2 days 19 hours ago
量子云平台
3 days 20 hours ago
Quantum Computing in Practice with Qiskit and IBM Quantum Experience
3 days 20 hours ago
IBM量子信息基础课程
3 days 20 hours ago
量子算法全集
2 weeks ago
爱给素材
1 month ago
AI世界生成工具
1 month ago
geogebra数学工具
1 month ago
能级跃迁
1 month ago

最新评论

Mate从LTS版本中移除。变成全部都是短期的版本… 3 months 2 weeks ago
关于ubuntu-mate 3 months 3 weeks ago
鱼与漁 4 months 3 weeks ago
SC娛樂城 9 months ago
感谢分享 9 months 2 weeks ago
我没有做过很全面仔细的测试，但在我测试不多的句子里… 10 months ago
语速不一有遇到过吗 10 months ago
26个拼音字母 1 year 4 months ago
如果要把基金从场内转到场外，需要先在场外购买对应基金… 1 year 4 months ago
GPL-2… 1 year 5 months ago