python如何爬取图片

  介绍

这篇文章主要介绍了python如何爬取图片,具有一定借鉴价值,需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获。下面让小编带着大家一起了解一下。

打开网址查看网页结构

用火狐浏览器打开链接F12查看

由于我使用的pyquery

可以看到图片的链接都在img标签的src属性中我们只要通过pyquery锁定到这个img标签就可以继续下一步了

我们先来尝试抓取一页的壁纸试试看

<强>下面是具体的代码:

# !/usr/bin/env python   # - * -编码:utf - 8 - *   # @Time: 2018/10/31 17:54   #爬取图片      进口的要求   从pyquery进口pyquery pq   导入的时间      头={   & # 39;用户代理# 39;:& # 39;Mozilla/5.0(麦金塔电脑;Intel Mac OS X 10 _11_4) AppleWebKit/537.36 & # 39;   & # 39;(KHTML,像壁虎)Chrome/52.0.2743.116 Safari 537.36 & # 39;   }   #这里我使用了代理你可以去掉这个代理IP我是为了后面大规模爬取做准备的   代理={   & # 39;https # 39;: & # 39; 218.75.69.50:39590& # 39;   }         #请求网页获取源码   def start_request (url):   r=请求。得到(url,头=头,代理=代理)   #这个网站页面使用的是GBK编码这里进行编码转换   r。编码=& # 39;gbk # 39;   html=r.text   返回的html         #解析网页获取图片   def解析(文本):   医生=pq(文本)   #锁定页面中的img标签   图像=doc (& # 39; div。ul列表li img # 39;) . items ()   x=0   形象的图片:   #获取每一张图片的链接   img_url=image.attr (& # 39; src # 39;)   #获得每张图片的二进制内容   img=请求。得到(img_url header=头,代理=代理).content   #定义要存储图片的路劲   路径=癋: \ \ \ \“形象;+ str (x) +“.jpg"   #将图片写入指定的目录写入文件用“wb"   张开(路径,& # 39;wb # 39;) f:   f.write (img)   time . sleep (1)   print(“正在下载第{}张图片“.format (x))   x +=1   print(“写入完成“)         def main ():   url=癶ttp://www.netbian.com"   文本=start_request (url)   解析(文本)         if __name__==癬_main__":   main ()

感谢你能够认真阅读完这篇文章,希望小编分享python如何爬取图片内容对大家有帮助,同时也希望大家多多支持,关注行业资讯频道,遇到问题就找,详细的解决方法等着你来学习!

python如何爬取图片