在熊猫里面常用value_counts确认数据出现的频率。
熊猫的value_counts()函数可以对系列里面的每个值进行计数并且排序。
熊猫作为pd导入 df=pd。DataFrame({的区域”:['西安”,“太原”,“西安”,“太原”,“郑州”,“太原”), “10月份销售”:[“0.477468”、“0.195046”、“0.015964”、“0.259654”、“0.856412”、“0.259644”), ”9月份销售”:[“0.347705”,“0.151220”,“0.895599”,“0236547”,“0.569841”,“0.254784”]}) 打印(df)
统计每个区域出现多少次:
print (df['区域'].value_counts ())
print (df['区域'].value_counts(升序=True)
print (df['区域'].value_counts(正常化=True))
熊猫作为pd导入 df=pd。DataFrame({的区域1 ':[“西安”,“太原”,“西安”,“太原”,“郑州”,“太原”), 的区域2》:['太原”,“太原”,“西安”,“西安”,“西安”,“太”原]}) 打印(df.apply (pd.value_counts)