<强> K线数据提取强>
依据原有数据集格式,按要求生成新表:
1,每分钟的关闭数据的第一条,最后一条,最大值及最小值,
2,每分钟卷数据的增长量(每分钟卷的最后一条数据减第一条数据)
3,汇总这些信息生成一个新表
(字段名:(“时间”,“开放”,“关闭”,“高”、“低”、“卷”))
熊猫作为pd导入 导入的时间 开始=time.time () df=pd.read_csv (“data.csv”) df=df.drop (“id”,轴=1)#删除id列 df1=pd.DataFrame(列=[“时间”,“开放”,“关闭”,“高”、“低”、“卷”))#新建目标数据表 因为我在df.groupby(时间):#按时间分组 new_df=pd.DataFrame(列=[“时间”,“开放”,“关闭”,“高”、“低”、“卷”))#新建空表用于临时转存要求数据 new_df.time=我[1]。时间(0:1)#取每组时间为新表时间 new_df.open=我[1]。关闭(0:1)#取每组第一个关闭数据为新表打开数据 new_df.close=我[1](“关闭”)。iloc[1] #取每组最后一个关闭数据为新表关闭数据 new_df.high=我[1]['关闭'].max() #取每组近数据最大值为新表髯数据 new_df.low=我[1]['关闭'].min() #取每组近数据最小值为新表低数据 new_df.vol=我[1](“卷”)。iloc[1],[1](“卷”)。iloc[0] #用每组卷数据最大值减去最小值为新表卷数据 df1=pd.concat ([new_df df1),轴=0)#纵向合并数据到目标数据表 df2=df1.sort_values(时间)#按时间列值进行排序 df2。reset_index(原地=True,放弃=True) #重置行索引 打印(df2) #打印目标数据表 停止=time.time() #查看耗时 打印(“共计耗时:{}秒”.format(即停))
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。