使用python爬虫怎么对图片进行爬取 - 行业资讯 - 肥雀云

　　介绍

使用python爬虫怎么对图片进行爬取?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

1,蜘蛛原理

蜘蛛就是定义爬取的动作及分析网站的地方。
以初始的URL * *初始化请求* *,并设置回调函数。当该请求* *下载完毕并返回时,将生成* *响应,并作为参数传给该回调函数。

2,实现python爬虫爬取图片

<强>第一步:导入正则表达式模块

import re #,导入正则表达式模块　　import requests #, python HTTP客户端,编写爬虫和测试服务器经常用到的模块　　import random #,随机生成一个数,范围[0,1]

<强>第二步:使用定义函数的方法爬取图片

def spiderPic (html,关键字): 　　打印才能(& # 39;正在查找,& # 39;,+,keyword +, & # 39;,对应的图片,下载中,请稍后……& # 39;) 　　for 才能;addr 拷贝re.findall (& # 39;“objURL":“(. * ?)“& # 39;,, html, re.S):, #,查找URL 　　,,,print(& # 39;正在爬取URL地址:& # 39;,+,str (addr)(破发),+,& # 39;……& # 39;), 　　,,,#,爬取的地址长度超过30时,用& # 39;……& # 39;代替后面的内容　　,,,试一试: 　　,,,,,pics =, requests.get (addr,超时=100),#,请求URL时间(最大10秒) 　　,,,except requests.exceptions.ConnectionError: 　　,,,,,印刷(& # 39;您当前请求的URL地址出现错误& # 39;) 　　,,,,,继续　　,,,fq =,开放(& # 39;H: \ \ img \ \ & # 39;, +,(时间+ keyword & # 39; _ # 39;, +, str (random.randrange (0,, 1000,, 4)), +, & # 39; jpg # 39;),, & # 39; wb # 39;), 　　,,,,#,下载图片,并保存和命名　　,,,fq.write (pics.content) 　　,,,fq.close ()

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注行业资讯频道,感谢您对的支持。