介绍
这篇文章给大家分享的是有关python怎么获取网页中所有图片并筛选指定分辨率的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
python的优点有哪些
1,简单易用,与C/c++、Java、c#等传统语言相比,python对代码格式的要求没有那么严格;2,python属于开源的,所有人都可以看到源代码,并且可以被移植在许多平台上使用;3,python面向对象,能够支持面向过程编程,也支持面向对象编程;4,python是一种解释性语言,python写的程序不需要编译成二进制代码,可以直接从源代码运行程序;5,python功能强大,拥有的模块众多,基本能够实现所有的常见功能。
压测时,图片太少,想着下载网页中的图片,然后过滤指定分辨率,但网页中指定分辨率的图片太少了(见下)
后使用格式工厂转换图片
import urllib.request ,, #,导入urllib模块 import re ,,,, #,导入再保险模块 import 操作系统 得到PIL import 形象 时间=htmlurl & # 39; http://www.win4000.com/wallpaper_detail_134824_3.html& # 39; 时间=downloadpath & # 39; C: \ \ \ \ yaowanjun \ \用户桌面\ \ img \ \ & # 39; def getHTML (htmlurl): 时间=req 才能;urllib.request.urlopen (htmlurl) 时间=buf 才能;req.read () return 才能;buf.decode (& # 39; utf - 8 # 39;) def downloadImg (buf): req 才能=," # 39;src=https://www.yisu.com/zixun/?+ ? \ . jpg)“#正则表达式,匹配图片格式 imgreq=re.compile(点播)#编译正则表达式 imglist=re.findall (imgreq buf) #打印(imglist) x=0 如果不是os.path.isdir (downloadpath): #若没有则创建 os.makedirs (downloadpath) 路径=downloadpath 在imglist imgurl: f=open(路径+ str (x) +“jpg”,“世界银行”)#打开文件 要求=urllib.request.urlopen (imgurl) buf=req.read() #读出文件 f.write (buf) f.close () x=x + 1 返回imglist def saveImg (): 在os.walk filenumber (downloadpath): #打印(filenumber [2]) 文件在filenumber [2]: #打印(文件) singleimg=形象。打开(downloadpath +文件) singleimg.close () # (singleimg打印。大小,singleimg。宽度,singleimg.height) 如果singleimg。大?=(1920、1080): 打印(singleimg) 其他: 操作系统。删除(downloadpath +文件) buf=getHTML (htmlurl) downloadImg (buf) saveImg ()
<强>执行结果:强>
指定网页所有图片
不符合指定分辨率的图片删除后
感谢各位的阅读!关于“python怎么获取网页中所有图片并筛选指定分辨率”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!