介绍
这篇文章将为大家详细讲解有关熊猫如何实现分区间,算频率、小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
<>强如下所示:强>
import pandas as pd=& # 39;路径F:/python/python数据分析与挖掘实战/图书配套数据,代码/第三章/演示/数据/catering_fish_congee.xls& # 39; data=https://www.yisu.com/zixun/pd.read_excel(路径,头=None, index_col=0) data.index.name='日期” data.columns=['销售额(元)”) xse=数据['销售额(元)”) print (xse.max ()) print (xse.min ()) 打印(xse.max () -xse.min ()) 泛威=列表(范围(0,4500,500)) fenzu=pd.cut (xse.values,泛威=False) #分组区间,长91度 打印(fenzu.codes) #标签 打印(fenzu.categories) #分组区间,长8度 pinshu=fenzu.value_counts() #系列、区间——个数 打印(pinshu.index) 进口matplotlib。pyplot作为plt pinshu.plot(类型=熬瓢伞? # plt.text(0, 29日,str (29)) qujian=pd.cut (xse,泛威=False) 数据['区间']=qujian.values data.groupby(“区间”).median () data.groupby(“区间”).mean() #每个区间平均数 pinshu_df=pd.DataFrame (pinshu列=['频数”)) pinshu_df['频率f ')=pinshu_df/pinshu_df[“频数”).sum () pinshu_df['频率% ')=pinshu_df[的频率f ']。地图(λx: ' % .2f % % % (x * 100)) pinshu_df['累计频率f ')=pinshu_df[的频率f '] .cumsum () pinshu_df['累计频率% ']=pinshu_df['累计频率f ']。地图(λx: ' % .4f % % % (x * 100)) 在[158]:pinshu_df [158]: 频数频率f频率%累计频率f累计频率% [0,500)29日0.318681 - 31.87% 0.318681 - 31.8681% (500,1000)20 0.219780 - 21.98% 0.538462 - 53.8462% (1000,1500)12 0.131868 - 13.19% 0.670330 - 67.0330% (1500,2000)12 0.131868 - 13.19% 0.802198 - 80.2198% (2000、2500)8 0.087912 - 8.79% 0.890110 - 89.0110% (2500,3000)3 0.032967 - 3.30% 0.923077 - 92.3077% (3000,3500)4 0.043956 - 4.40% 0.967033 - 96.7033% (3500,4000)3 0.032967 - 3.30% 1.000000 - 100.0000%