介绍
如何在Python中使用CSV文件模块?针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。
<强> 1,CSV模块使用流程强>
<>强导入模块强>
impport CSV
<强> 2,打开文件(xxx。csv) 强>
with 开放(& # 39;xxx.csv& # 39; & # 39;一个# 39;,编码=& # 39;utf - 8 # 39;), as f:
- <李>
1,和一个+,,“追加& # 39;功能
李>a 追加写
+追加写读(先写后读)
- <李>
2 r和r +,,
李>r只读
r +读写,先读后写
- <李>
3 w w +
李>w只写
w +写读先写后读
<强> 3,初始化写入对象强>
writer =, csv.wirter ()
<强> 4,写入数据强>
writer.writerow((& # 39;孙悟空& # 39;,,& # 39;兰陵王& # 39;])
<强>案例:强>
猫眼电影全球名列榜单的爬取
<强> 1,网址:url 强>
<强> 2,目标:爬取自己想要的文件强>
<强> 3,保存本地:csv文件强>
<强> 4步骤强>
- <李>
1,找url规律
李>第一页:https://maoyan.com/board/4?offset=0
第4页:https://maoyan.com/board/4?抵消=30 n
第页:抵消=(n - 1) * 10
- <李>
2,写正则表达式
李>& # 39; & lt; div类=癿ovie-item-info"。* ? title=?. * ?)“。* ?类=皊tar"祝辞(。*)& lt;/p>。* ?类=皉eleasetime"祝辞(. * ?)& lt;/p> & # 39;再保险。S
<>强练习:爬取猫王全球信息强>
得到urllib import 请求 import 再保险 import 时间 import csv class MaoyanSpider(对象): ,,def __init__(自我): ,,,self.headers =, {“User-Agent":“Mozilla/5.0, (Windows NT 6.1;,房车:2.0.1),壁虎/20100101,Firefox/4.0.1"} ,,,self.page =1 ,,,#,用来计数 ,,def get_page(自我,url): ,,,req =, request.Request (url,头=self.headers) ,,,res =, request.urlopen(要求) ,,,html =, res.read () .decode (& # 39; utf - 8 # 39;) ,,,#,直接调用解析函数 ,,,self.parse_page (html) ,,def parse_page(自我、html): ,,,,p=re.compile (& # 39; & lt; div 类=癿ovie-item-info"祝辞。* ? title=?. * ?)“。* ?类=皊tar"祝辞(. * ?)& lt;/p>。* ?类=皉eleasetime"祝辞(. * ?)& lt;/p> & # 39;, re.S) ,,,,# p=re.compile (& # 39; & lt; div 类=癿ovie-item-info"祝辞。* ? title=?. * ?)“。* ?类=皊tar"祝辞(*,?)& lt;/p>。* ?类=皉eleasetime"祝辞(. * ?)& lt;/p> & # 39;, re.S) ,,,,r_list =, p.findall (html) ,,,,#,直接调用保存函数 ,,,,#,r_list:[(& # 39;霸王别姬& # 39;,& # 39;张国荣& # 39;,& # 39;1993 & # 39;),(),()) ,,,,self.write_csv (r_list) #,才能保存数据函数 ,,,def write_csv(自我,r_list): ,,,,with 开放(& # 39;猫眼电影top10.csv& # 39;, & # 39;一个# 39;),as f: ,,,,,writer =, csv.writer (f) ,,,,,#,依次写入每个电影信息 ,,,,,for r_t 拷贝r_list: ,,,,,,,film =, ( ,,,,,,,,,r_t [0] .strip (), ,,,,,,,,,r_t [1] .strip (), ,,,,,,,,,r_t [2] .strip () ,,,,,,,,,) ,,,,,,,writer.writerow(电影) #主才能函数 ,,def work_om(自我): ,,,,for pn 拷贝范围(0,41岁,10): ,,,,,url =, & # 39; https://maoyan.com/board/4?offset=%s& # 39; % str (pn) ,,,,,self.get_page (url) ,,,,,印刷(& # 39;第% d页爬取成功& # 39;% self.page) ,,,,,self.page +=1 ,,,,,time . sleep (4) if __name__ ==& # 39; __main__ # 39;: 时间=begin 才能;time.time () 时间=spider 才能;MaoyanSpider () spider.work_om才能() 最终获得才能=,time.time () 打印才能(“执行时间% .2f" %(最终获得;安康;开始))
运行截图:
关于如何在Python中使用CSV文件模块问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注行业资讯频道了解更多相关知识。