本篇内容介绍了“利用Python爬取豆瓣读书页面源码分享”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
源代码如下:
<代码> #编码:utf-8from硒进口webdriverclass豆瓣:
def __init__(自我):
自我。=webdriver.Chrome博士()#指定硒进行自动化操作时选用谷歌浏览器
self.dr.get (& # 39; https://book.douban.com/tag/%E5%B0%8F%E8%AF%B4/& # 39;) #要打开的网页
def print_content(自我):
total_book=self.dr.find_element_by_id(& # 39;包装# 39;)#先定位到包含所有图书的div盒子中
的书=total_book.find_elements_by_class_name(& # 39;信息# 39;)#找到已经定位到的div盒子里的每一个包含图书介绍的子div
i=1
的书书:#通过对循环依次把每一本图书的内容取出来
打印(str (i) +书。文本+ & # 39;
& # 39;) #将爬取到的内容打印
我+=1
def辞职(自我):
self.dr.quit() #爬取数据完成后关闭浏览器
豆瓣().print_content() 代码>