使用python爬虫怎么对图片进行爬取

  介绍

使用python爬虫怎么对图片进行爬取?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

1,蜘蛛原理

蜘蛛就是定义爬取的动作及分析网站的地方。
以初始的URL * *初始化请求* *,并设置回调函数。当该请求* *下载完毕并返回时,将生成* *响应,并作为参数传给该回调函数。

2,实现python爬虫爬取图片

<强>第一步:导入正则表达式模块

import  re  #,导入正则表达式模块   import  requests  #, python  HTTP客户端,编写爬虫和测试服务器经常用到的模块   import  random  #,随机生成一个数,范围[0,1]

<强>第二步:使用定义函数的方法爬取图片

def  spiderPic (html,关键字):   打印才能(& # 39;正在查找,& # 39;,+,keyword  +, & # 39;,对应的图片,下载中,请稍后……& # 39;)   for 才能;addr 拷贝re.findall (& # 39;“objURL":“(. * ?)“& # 39;,, html, re.S):, #,查找URL   ,,,print(& # 39;正在爬取URL地址:& # 39;,+,str (addr)(破发),+,& # 39;……& # 39;),   ,,,#,爬取的地址长度超过30时,用& # 39;……& # 39;代替后面的内容   ,,,试一试:   ,,,,,pics =, requests.get (addr,超时=100),#,请求URL时间(最大10秒)   ,,,except  requests.exceptions.ConnectionError:   ,,,,,印刷(& # 39;您当前请求的URL地址出现错误& # 39;)   ,,,,,继续   ,,,fq =,开放(& # 39;H: \ \ img \ \ & # 39;, +,(时间+ keyword  & # 39; _ # 39;, +, str (random.randrange (0,, 1000,, 4)), +, & # 39; jpg # 39;),, & # 39; wb # 39;),   ,,,,#,下载图片,并保存和命名   ,,,fq.write (pics.content)   ,,,fq.close ()

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注行业资讯频道,感谢您对的支持。

使用python爬虫怎么对图片进行爬取