批量下载贴吧图片的方法,一次性抓取所有帖子

2021/06/20 0 条评论 177 次阅读 0 人点赞

通常手动下载,或者通过插件下载贴吧图片,都是一个页面一个页面下,比较费时费力。这里介绍一种批量下载贴吧所有帖子图片的方法。首先下载本站的“鸿言图片批量下载”软件,安装运行。然后按照下面的步骤一步步操作。

1、用浏览器打开对应的贴吧,复制网址。

2、在鸿言图片批量下载软件上,点击新建任务按钮,打开任务窗口。把刚才复制的网址粘贴到“初始页面”项目中,并填写任务名称,修改深度为3层,设置保存路径,点选“按页面划分目录”。

注:

1)深度3层,分别代表首页、分页页面、帖子页面,如果层数设置过多影响效率,设置过少抓取不到图片。

2)按页面划分目录,可以把每个帖子的图片单独放在对应的一个文件夹中,方便整理。

下面3、4两步是查看网页源代码,寻找页面网址规律,可以直接跳过这两步。但如果弄懂了这两步的操作方法和原理,以后下载别的网站图片也游刃有余了。

3、在对应贴吧的页面上右击鼠标,在弹出的右键菜单中,选择“查看网页源代码”,或者按“Ctrl+U”组合键,打开源代码窗口。

4、翻找如下两个网址所在的地方,一是帖子网址,类似“/p/5727155519”;二是分页网址,类似“//tieba.baidu.com/f?kw=%E5%AD%99%E5%85%81%E7%8F%A0&ie=utf-8&pn=50”。这些网址都包含在“href=""”这段代码里。

说明:

1)帖子网址中“5727155519”是帖子具体ID,我们需要的是这个ID之前的那段文本,也就是“/p/”,并在后面加上“*”号。

2)分页网址中“kw=”到“&ie”之间的一串文本是贴吧名称,这里显示的像乱码,其实是中文被编码了,我们也用“*”号代替。

3)分页网址最后的“pn=50”,后面的“50”也用“*”号代替。

这样我们就得到两条分别代表帖子网址和分页网址的过滤代码:

/p/*

//tieba.baidu.com/f?kw=*&ie=utf-8&pn=*

5、切换到鸿言图片批量下载软件,点击任务窗口上的“设置过滤”按钮,把以上过滤代码复制到过滤窗口中,并勾选“只保留符合以下规则的网址”。然后点击保存。

注:这一步可以精确抓取所需网址,大大缩短时间,提高效率。

6、点击“登录网页”按钮,然后在登录网页窗口中根据页面的提示,用手机浏览器扫码并进行对应操作。再点击“确定已登录”。

注:贴吧使用了安全登录机制,在打开贴吧之前可能需要进行这一步操作,否则获取不到帖子和图片。

7、回到任务窗口,填写尺寸限制,比如最小宽度为300,避免下载不需要的图标类小图片。然后勾选“立即开始下载”,再点击“保存”按钮。

8、软件开始自动下载图片,其中下面的列表是获取网页的进程,上面的列表是下载图片的进程。可以暂停或继续下载对应的任务。

9、下载完毕后,打开下载目录,可以看到贴吧图片已经下载到按页面标题创建的文件夹中了。

鸿言图片批量下载软件是一款通用的网页图片批量下载工具,不仅仅可以下载贴吧图片,也可以下载其他网站的图片,只需按照以上的步骤进行变通即可。

软件介绍页面:http://www.hystudio.net/881.html

人脉管理软件

渺孤鸿

鸿言软件工作室

文章评论(0)