熊猫如何实现分区间,算频率

  介绍

这篇文章将为大家详细讲解有关熊猫如何实现分区间,算频率、小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

<>强如下所示:

import  pandas  as  pd=& # 39;路径F:/python/python数据分析与挖掘实战/图书配套数据,代码/第三章/演示/数据/catering_fish_congee.xls& # 39;   data=https://www.yisu.com/zixun/pd.read_excel(路径,头=None, index_col=0)   data.index.name='日期”   data.columns=['销售额(元)”)      xse=数据['销售额(元)”)   print (xse.max ())   print (xse.min ())   打印(xse.max () -xse.min ())      泛威=列表(范围(0,4500,500))   fenzu=pd.cut (xse.values,泛威=False) #分组区间,长91度   打印(fenzu.codes) #标签   打印(fenzu.categories) #分组区间,长8度   pinshu=fenzu.value_counts() #系列、区间——个数   打印(pinshu.index)      进口matplotlib。pyplot作为plt   pinshu.plot(类型=熬瓢伞?   # plt.text(0, 29日,str (29))         qujian=pd.cut (xse,泛威=False)   数据['区间']=qujian.values   data.groupby(“区间”).median ()   data.groupby(“区间”).mean() #每个区间平均数      pinshu_df=pd.DataFrame (pinshu列=['频数”))   pinshu_df['频率f ')=pinshu_df/pinshu_df[“频数”).sum ()   pinshu_df['频率% ')=pinshu_df[的频率f ']。地图(λx: ' % .2f % % % (x * 100))      pinshu_df['累计频率f ')=pinshu_df[的频率f '] .cumsum ()   pinshu_df['累计频率% ']=pinshu_df['累计频率f ']。地图(λx: ' % .4f % % % (x * 100))      在[158]:pinshu_df   [158]:   频数频率f频率%累计频率f累计频率%   [0,500)29日0.318681 - 31.87% 0.318681 - 31.8681%   (500,1000)20 0.219780 - 21.98% 0.538462 - 53.8462%   (1000,1500)12 0.131868 - 13.19% 0.670330 - 67.0330%   (1500,2000)12 0.131868 - 13.19% 0.802198 - 80.2198%   (2000、2500)8 0.087912 - 8.79% 0.890110 - 89.0110%   (2500,3000)3 0.032967 - 3.30% 0.923077 - 92.3077%   (3000,3500)4 0.043956 - 4.40% 0.967033 - 96.7033%   (3500,4000)3 0.032967 - 3.30% 1.000000 - 100.0000%

熊猫如何实现分区间,算频率

熊猫如何实现分区间,算频率