熊猫计数value_counts()的使用 - 行业资讯 - 肥雀云

在熊猫里面常用value_counts确认数据出现的频率。

熊猫的value_counts()函数可以对系列里面的每个值进行计数并且排序。

　　　　　　熊猫作为pd导入　　df=pd。DataFrame({的区域”:['西安”,“太原”,“西安”,“太原”,“郑州”,“太原”), 　　“10月份销售”:[“0.477468”、“0.195046”、“0.015964”、“0.259654”、“0.856412”、“0.259644”), 　　”9月份销售”:[“0.347705”,“0.151220”,“0.895599”,“0236547”,“0.569841”,“0.254784”]}) 　　打印(df) 　　　　

统计每个区域出现多少次:

　　　　　　print (df['区域'].value_counts ()) 　　　　

熊猫计数value_counts()的使用“> 
　　每个区域都被计数,并且默认从高到低排序。
　　如果想升序排列,设置参数提升=True: 
　　
　　<pre类= 　　print (df['区域'].value_counts(升序=True)

熊猫计数value_counts()的使用“> 
　　如果想得出计数占比,可以加参数=True正常化
　　
　　<pre类= 　　print (df['区域'].value_counts(正常化=True))

熊猫计数value_counts()的使用“> 
　　注:空值默认剔除掉的.value_counts()返回的结果是一个系列数组,可以跟别的数组进行计算。
　　 
　　
　　<pre类= 　　熊猫作为pd导入　　df=pd。DataFrame({的区域1 ':[“西安”,“太原”,“西安”,“太原”,“郑州”,“太原”), 　　的区域2》:['太原”,“太原”,“西安”,“西安”,“西安”,“太”原]}) 　　打印(df.apply (pd.value_counts)

熊猫计数value_counts()的使用“> 
　　区域2中没有郑州,所以是NaN。
　　以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。<h2 class= 熊猫计数value_counts()的使用