python数据提取及拆分的实现代码

  

<强> K线数据提取

  

 python数据提取及拆分的实现代码

  

依据原有数据集格式,按要求生成新表:

  

1,每分钟的关闭数据的第一条,最后一条,最大值及最小值,

  

2,每分钟卷数据的增长量(每分钟卷的最后一条数据减第一条数据)

  

3,汇总这些信息生成一个新表

  

(字段名:(“时间”,“开放”,“关闭”,“高”、“低”、“卷”))

        熊猫作为pd导入   导入的时间   开始=time.time ()   df=pd.read_csv (“data.csv”)   df=df.drop (“id”,轴=1)#删除id列   df1=pd.DataFrame(列=[“时间”,“开放”,“关闭”,“高”、“低”、“卷”))#新建目标数据表      因为我在df.groupby(时间):#按时间分组   new_df=pd.DataFrame(列=[“时间”,“开放”,“关闭”,“高”、“低”、“卷”))#新建空表用于临时转存要求数据   new_df.time=我[1]。时间(0:1)#取每组时间为新表时间   new_df.open=我[1]。关闭(0:1)#取每组第一个关闭数据为新表打开数据   new_df.close=我[1](“关闭”)。iloc[1] #取每组最后一个关闭数据为新表关闭数据   new_df.high=我[1]['关闭'].max() #取每组近数据最大值为新表髯数据   new_df.low=我[1]['关闭'].min() #取每组近数据最小值为新表低数据   new_df.vol=我[1](“卷”)。iloc[1],[1](“卷”)。iloc[0] #用每组卷数据最大值减去最小值为新表卷数据   df1=pd.concat ([new_df df1),轴=0)#纵向合并数据到目标数据表      df2=df1.sort_values(时间)#按时间列值进行排序   df2。reset_index(原地=True,放弃=True) #重置行索引   打印(df2) #打印目标数据表   停止=time.time() #查看耗时   打印(“共计耗时:{}秒”.format(即停))      

 python数据提取及拆分的实现代码

  

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。

python数据提取及拆分的实现代码