介绍
这篇文章主要介绍了Python爬取车12306次信息的案例,具有一定借鉴价值,需要的朋友可以参考下。希望大家阅读完这篇文章后大有收获。下面让小编带着大家一起了解一下。
详情查看下面的代码:
如果被识别就要添加一个饼干如果没有被识别的话就要一个用户代理就好了。如果出现乱码就设置编码格式为utf - 8
#静态的数据一般在元素中(复制文字到来源按ctrl + f搜索。找到的为静态),而动态去网络中去寻找相关的信息 进口的要求 进口再保险 def send_request (): 头={& # 39;用户代理# 39;:& # 39;Mozilla/5.0 (Windows NT 10.0;Win64;x64) AppleWebKit/537.36 (KHTML,像壁虎)Chrome/74.0.3729.131 Safari 537.36 & # 39; & # 39;饼干# 39;:& # 39;_uab_collina=159618052151589201474313;JSESSIONID=D33C89D8BEC6A692C79CFA69FC0B0D29;BIGipServerotn=233832970.24610.0000;BIGipServerpool_passport=216859146.50215.0000;RAIL_EXPIRATION=1596443951465;RAIL_DEVICEID=nMo94O2Z21cXLblW7otLoxUZ_LP9Q01PYj_I89OqU6MqjxyX9814Jc3CH5TNwgBVJqnBaBG8OGiBWo2QtNcu5wVu-asNk6YLa49g0fMwVp03XFJQ-GkhHYHcqIgUd-nqQB_VEdWH1Om_D2yAgIu8QcEavt02pmH5;路线=c5c62a339e7744272a54643b3be5bf64;_jc_save_fromStation=% u5317%u4EAC % 2 cbjp;_jc_save_toStation=% u5929%u6D25 % 2 ctjp;_jc_save_fromDate=2020-07-31;_jc_save_toDate=2020-07-31;_jc_save_wfdc_flag=直流# 39;}#创建头部信息 url=& # 39; https://kyfw.12306.cn/otn/leftTicket/query& # 63; leftTicketDTO.train_date=2020 - 07 - 31, leftTicketDTO.from_station=BJP& leftTicketDTO.to_station=TJP& purpose_codes=成人# 39; #设置编码格式。防止乱码 resp=requests.get (url,头=标题) resp.encoding=& # 39; utf - 8 # 39; 返回职责 #解析数据 #{}是字典。根据关键获取值。 def parse_json(职责、城市): json_ticket=resp.json() #将相应的数据转换为json data_list=json_ticket[& # 39;数据# 39;][& # 39;结果# 39;]#得到车次的列的表 lst=[] #列表 在data_list:项 #遍历车次信息进行分割 d=item.split (& # 39; | & # 39;) lst.append ([[3], [6] [d], [d [7]], [31], [30], d [13]]) 返回lst & # 39;& # 39;& # 39; d[3]从列表中获取索引为3的表示车次 d[6]查询起始站 d[7]查询到达站 d[31]一等座 d[30]表示二等座 d[13]表示出行时间& # 39;& # 39;& # 39; #获得station_name的信息 def get_city (): url=& # 39; https://kyfw.12306.cn/otn/resources/js/framework/station_name.js& # 63; station_version=1.9151 & # 39; 头={& # 39;用户代理# 39;:& # 39;Mozilla/5.0 (Windows NT 10.0;Win64;x64) AppleWebKit/537.36 (KHTML,像壁虎)Chrome/74.0.3729.131 Safari 537.36 & # 39;} resp=requests.get (url,头=标题) resp.encoding=& # 39; utf - 8 # 39; #进行数据的提取(只要一部分) 站=re.findall (& # 39; ([\ u4e00 - \ u9fa5] +) \ | ([a - z] +) & # 39;, resp.text) #将列表进行转换为字典 stations_data=dict(站) #键与值进行互换 station_d={} #空字典。用于完成上述操作 在stations_data:项 station_d [stations_data[项目]]=项目 #打印(station_d) 返回station_d def开始(): lst=parse_json (send_request (), get_city ()) #进行数据的筛选(得到有效的数据) 因为我在lst: 如果我[3]!=& # 39;无& # 39;我[3]!=& # 39;& # 39;: 打印(我) if __name__==& # 39; __main__ # 39;: start() #开始
运行的截图:
感谢你能够认真阅读完这篇文章,希望小编分享Python爬取车12306次信息的案例内容对大家有帮助,同时也希望大家多多支持,关注行业资讯频道,遇到问题就找,详细的解决方法等着你来学习!