熊猫计数value_counts()的使用

  

在熊猫里面常用value_counts确认数据出现的频率。

  

  

熊猫的value_counts()函数可以对系列里面的每个值进行计数并且排序。

        熊猫作为pd导入   df=pd。DataFrame({的区域”:['西安”,“太原”,“西安”,“太原”,“郑州”,“太原”),   “10月份销售”:[“0.477468”、“0.195046”、“0.015964”、“0.259654”、“0.856412”、“0.259644”),   ”9月份销售”:[“0.347705”,“0.151220”,“0.895599”,“0236547”,“0.569841”,“0.254784”]})   打印(df)      

统计每个区域出现多少次:

        print (df['区域'].value_counts ())      

熊猫计数value_counts()的使用“> </p>
  <p>每个区域都被计数,并且默认从高到低排序。</p>
  <p>如果想升序排列,设置参数提升=True: </p>
  
  <pre类=   print (df['区域'].value_counts(升序=True)      

熊猫计数value_counts()的使用“> </p>
  <p>如果想得出计数占比,可以加参数=True正常化</p>
  
  <pre类=   print (df['区域'].value_counts(正常化=True))      

熊猫计数value_counts()的使用“> </p>
  <p>注:空值默认剔除掉的.value_counts()返回的结果是一个系列数组,可以跟别的数组进行计算。</p>
  <p> </p>
  
  <pre类=   熊猫作为pd导入   df=pd。DataFrame({的区域1 ':[“西安”,“太原”,“西安”,“太原”,“郑州”,“太原”),   的区域2》:['太原”,“太原”,“西安”,“西安”,“西安”,“太”原]})   打印(df.apply (pd.value_counts)      

熊猫计数value_counts()的使用“> </p>
  <p>区域2中没有郑州,所以是NaN。</p>
  <p>以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。</p><h2 class=熊猫计数value_counts()的使用