熊猫中对时间这个属性的处理有非常非常多的操作。
而本文对其中一个大家可能比较陌生的方法进行讲解。其他的我会陆续上传。
应用情景是这样的:考虑到有一个数据集,数据集中有用户注册账号的时间(年-月-日),如下图格式。
熊猫作为pd导入
td=数据(“user_reg_tm”)
时间=pd.to_datetime (td)
开始=pd.datetime (2016、4、16)
一天=启动时间
最后,把天数插入到原来的表中
数据['天']=天
日期=pd.Series ([' 2016411 '])
pd.to_datetime(日期)
这样就创建一个时间为2016-4-11的时间值。
这里有个细节,就是字符串里的时间格式,年月日之间如果没有分隔,熊猫会自动用——号分开,如果要自己手动分隔,例如
日期=pd.Series ([' 2016-4-11 '])
这也可以,或者用/号。但是注意,只能用,或者/来进行分隔,不可使用别的。
有时候我们还需要有时分秒的信息。
日期=pd。系列([' 2016-4-11 12:12:12 '])
最后再说下一个问题,上面我获得的天数后我们怎么单独取出“天数”来呢?
很简单,用要擦防晒霜来访问。
对于系列类型,用data.dt.days
对于,Timedelta类型,可以直接访问,即data.days。
例如:
因(“天”)是为数据系列类型的
数据('天'].dt.days
因为天是Timedelta类型的
的一天。天
更新:时间处理下篇链接点击打开链接
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。