介绍
了解python爬虫怎样获取知乎问答内容?这个问题可能是我们日常学习或工作经常见到的。希望通过这个问题能让你收获颇深。下面是小编给大家带来的参考内容,让我们一起来看看吧!
xsrf
findallfind_all
def 登录(秘密,,账户): ,,,#,通过输入的用户名判断是否是手机号 ,,,if re.match (r" ^ 1 \ d{10}“美元;,,账户): ,,,,,,,印刷(“手机号登录,\ n") ,,,,,,,post_url =, & # 39; https://www.zhihu.com/login/phone_num& # 39; ,,,,,,,postdata =, { ,,,,,,,,,,,& # 39;_xsrf& # 39;:, get_xsrf (), ,,,,,,,,,,,& # 39;密码# 39;:,秘密, ,,,,,,,,,,,& # 39;remember_me& # 39;:, & # 39;真正的# 39; ,,,,,,,,,,,& # 39;phone_num& # 39;:,, ,,,,,,,} ,,,: ,,,,,,,if “@",拷贝帐户: ,,,,,,,,,,,印刷(“邮箱登录,\ n") ,,,,,,,其他的: ,,,,,,,,,,,印刷(“你的账号输入有问题,请重新登录“) ,,,,,,,,,,,return 0 ,,,,,,,post_url =, & # 39; https://www.zhihu.com/login/email& # 39; ,,,,,,,postdata =, { ,,,,,,,,,,,& # 39;_xsrf& # 39;:, get_xsrf (), ,,,,,,,,,,,& # 39;密码# 39;:,秘密, ,,,,,,,,,,,& # 39;remember_me& # 39;:, & # 39;真正的# 39; ,,,,,,,,,,,& # 39;电子邮件# 39;:,, ,,,,,,,} ,,,试一试: ,,,,,,,#,不需要验证码直接登录成功 ,,,,,,,login_page =, session.post (post_url, data=https://www.yisu.com/zixun/postdata,标题=标题) login_code=login_page.text 打印(login_page.status_code) 打印(login_code) 除了: #需要输入验证码后才能登录成功 postdata(“验证码”)=get_captcha () login_page=会话。帖子(post_url、数据=postdata头=标题) login_code=eval (login_page.text) print (login_code[‘味精’]) session.cookies.save () 试一试: 输入=raw_input 除了: 通过
loginpost xrsf cookiecookiecookie
# lwp -饼干- 2.0 Set-Cookie3: cap_id=癨“YWJkNTkxYzhiMGYwNDU2OGI4NDUxN2FlNzBmY2NlMTY=| 1487052577 | 4 aacd7a27b11a852e637262bb251d79c6cf4c8dc \“,,,=路径“/?,域=?zhihu.com",, path_spec;,到期=?017 - 03 - 16,06:09:37Z";版本=0 Set-Cookie3: l_cap_id=癨“OGFmYTk3ZDA3YmJmNDQ4YThiNjFlZjU3NzQ5NjZjMTA=| 1487052577 | 0 f66a8f8d485bc85e500a121587780c7c8766faf \“,,,=路径“/?,域=?zhihu.com",, path_spec;,到期=?017 - 03 - 16,06:09:37Z";版本=0 Set-Cookie3:登录=癨“NmYxMmU0NWJmN2JlNDY2NGFhYzZiYWIxMzE5ZTZiMzU=| 1487052597 | a57652ef6e0bbbc9c4df0a8a0a59b559d4e20456 \“,,,=路径“/?,域=?zhihu.com",, path_spec;,到期=?017 - 03 - 16,06:09:57Z";版本=0 Set-Cookie3: q_c1=癳e29042649aa4f87969ed193acb6cb83 | 1487052577000 | 1487052577000“,,=路径“/?,域=?zhihu.com",, path_spec;,到期=?020 - 02 - 14,06:09:37Z";版本=0 Set-Cookie3: z_c0=癨“QUFCQTFCOGdBQUFYQUFBQVlRSlZUVFVzeWxoZzlNbTYtNkt0Qk1NV0JLUHZBV0N6NlNNQmZ3PT0=| 1487052597 | dcf272463c56dd6578d89e3ba543d46b44a22f68 \“,,,=路径“/?,域=?zhihu.com",, path_spec;,到期=?017 - 03 - 16,06:09:57Z",, httponly=没有;版本=0 , 这是饼干文件的内容 以下是源码: , # !/usr/bin/env python #,- *安康;编码:utf-8 - * - import 请求 试一试: ,,,import cookielib 除了: ,,,import http.cookiejar as cookielib import 再保险 import 时间 import os.path 试一试: ,,,,得到PIL import 形象 除了: null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null null nullpython爬虫怎样获取知乎问答内容