利用Python爬取豆瓣读书页面源码分享 - 行业资讯 - 肥雀云

本篇内容介绍了“利用Python爬取豆瓣读书页面源码分享”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

源代码如下:

 <代码> #编码:utf-8from硒进口webdriverclass豆瓣:
 
 def __init__(自我):
 
自我。=webdriver.Chrome博士()#指定硒进行自动化操作时选用谷歌浏览器
 
 self.dr.get (& # 39; https://book.douban.com/tag/%E5%B0%8F%E8%AF%B4/& # 39;) #要打开的网页
 
 def print_content(自我):
 
 total_book=self.dr.find_element_by_id(& # 39;包装# 39;)#先定位到包含所有图书的div盒子中
 
的书=total_book.find_elements_by_class_name(& # 39;信息# 39;)#找到已经定位到的div盒子里的每一个包含图书介绍的子div 
 
 i=1 
 
的书书:#通过对循环依次把每一本图书的内容取出来
 
打印(str (i) +书。文本+ & # 39;
 
 & # 39;) #将爬取到的内容打印
 
我+=1 
 
 def辞职(自我):
 
 self.dr.quit() #爬取数据完成后关闭浏览器
 
豆瓣().print_content()