python爬虫怎样获取知乎问答内容

  介绍

了解python爬虫怎样获取知乎问答内容?这个问题可能是我们日常学习或工作经常见到的。希望通过这个问题能让你收获颇深。下面是小编给大家带来的参考内容,让我们一起来看看吧!

 python爬虫怎样获取知乎问答内容


xsrf

 python爬虫怎样获取知乎问答内容


findallfind_all

def 登录(秘密,,账户):   ,,,#,通过输入的用户名判断是否是手机号   ,,,if  re.match (r" ^ 1 \ d{10}“美元;,,账户):   ,,,,,,,印刷(“手机号登录,\ n")   ,,,,,,,post_url =, & # 39; https://www.zhihu.com/login/phone_num& # 39;   ,,,,,,,postdata =, {   ,,,,,,,,,,,& # 39;_xsrf& # 39;:, get_xsrf (),   ,,,,,,,,,,,& # 39;密码# 39;:,秘密,   ,,,,,,,,,,,& # 39;remember_me& # 39;:, & # 39;真正的# 39;   ,,,,,,,,,,,& # 39;phone_num& # 39;:,,   ,,,,,,,}   ,,,:   ,,,,,,,if “@",拷贝帐户:   ,,,,,,,,,,,印刷(“邮箱登录,\ n")   ,,,,,,,其他的:   ,,,,,,,,,,,印刷(“你的账号输入有问题,请重新登录“)   ,,,,,,,,,,,return  0   ,,,,,,,post_url =, & # 39; https://www.zhihu.com/login/email& # 39;   ,,,,,,,postdata =, {   ,,,,,,,,,,,& # 39;_xsrf& # 39;:, get_xsrf (),   ,,,,,,,,,,,& # 39;密码# 39;:,秘密,   ,,,,,,,,,,,& # 39;remember_me& # 39;:, & # 39;真正的# 39;   ,,,,,,,,,,,& # 39;电子邮件# 39;:,,   ,,,,,,,}   ,,,试一试:   ,,,,,,,#,不需要验证码直接登录成功   ,,,,,,,login_page =, session.post (post_url, data=https://www.yisu.com/zixun/postdata,标题=标题)   login_code=login_page.text   打印(login_page.status_code)   打印(login_code)   除了:   #需要输入验证码后才能登录成功   postdata(“验证码”)=get_captcha ()   login_page=会话。帖子(post_url、数据=postdata头=标题)   login_code=eval (login_page.text)   print (login_code[‘味精’])   session.cookies.save ()   试一试:   输入=raw_input   除了:   通过

loginpost xrsf cookiecookiecookie

# lwp -饼干- 2.0   Set-Cookie3: cap_id=癨“YWJkNTkxYzhiMGYwNDU2OGI4NDUxN2FlNzBmY2NlMTY=| 1487052577 | 4 aacd7a27b11a852e637262bb251d79c6cf4c8dc \“,,,=路径“/?,域=?zhihu.com",, path_spec;,到期=?017 - 03 - 16,06:09:37Z";版本=0   Set-Cookie3: l_cap_id=癨“OGFmYTk3ZDA3YmJmNDQ4YThiNjFlZjU3NzQ5NjZjMTA=| 1487052577 | 0 f66a8f8d485bc85e500a121587780c7c8766faf \“,,,=路径“/?,域=?zhihu.com",, path_spec;,到期=?017 - 03 - 16,06:09:37Z";版本=0   Set-Cookie3:登录=癨“NmYxMmU0NWJmN2JlNDY2NGFhYzZiYWIxMzE5ZTZiMzU=| 1487052597 | a57652ef6e0bbbc9c4df0a8a0a59b559d4e20456 \“,,,=路径“/?,域=?zhihu.com",, path_spec;,到期=?017 - 03 - 16,06:09:57Z";版本=0   Set-Cookie3: q_c1=癳e29042649aa4f87969ed193acb6cb83 | 1487052577000 | 1487052577000“,,=路径“/?,域=?zhihu.com",, path_spec;,到期=?020 - 02 - 14,06:09:37Z";版本=0   Set-Cookie3: z_c0=癨“QUFCQTFCOGdBQUFYQUFBQVlRSlZUVFVzeWxoZzlNbTYtNkt0Qk1NV0JLUHZBV0N6NlNNQmZ3PT0=| 1487052597 | dcf272463c56dd6578d89e3ba543d46b44a22f68 \“,,,=路径“/?,域=?zhihu.com",, path_spec;,到期=?017 - 03 - 16,06:09:57Z",, httponly=没有;版本=0   ,   这是饼干文件的内容   以下是源码:   ,   # !/usr/bin/env  python   #,- *安康;编码:utf-8  - * -   import 请求   试一试:   ,,,import  cookielib   除了:   ,,,import  http.cookiejar  as  cookielib   import 再保险   import 时间   import  os.path   试一试:   ,,,,得到PIL  import 形象   除了:   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null   null

python爬虫怎样获取知乎问答内容