利用Python爬取豆瓣读书页面源码分享

本篇内容介绍了“利用Python爬取豆瓣读书页面源码分享”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

源代码如下:

 <代码> #编码:utf-8from硒进口webdriverclass豆瓣:

def __init__(自我):

自我。=webdriver.Chrome博士()#指定硒进行自动化操作时选用谷歌浏览器

self.dr.get (& # 39; https://book.douban.com/tag/%E5%B0%8F%E8%AF%B4/& # 39;) #要打开的网页

def print_content(自我):

total_book=self.dr.find_element_by_id(& # 39;包装# 39;)#先定位到包含所有图书的div盒子中

的书=total_book.find_elements_by_class_name(& # 39;信息# 39;)#找到已经定位到的div盒子里的每一个包含图书介绍的子div

i=1

的书书:#通过对循环依次把每一本图书的内容取出来

打印(str (i) +书。文本+ & # 39;

& # 39;) #将爬取到的内容打印

我+=1

def辞职(自我):

self.dr.quit() #爬取数据完成后关闭浏览器

豆瓣().print_content()

利用Python爬取豆瓣读书页面源码分享