1)利用DataFrame中的重复的方法返回一个布尔型的系列,显示各行是否有重复行,没有重复行显示为假,有重复行显示为真;
2)再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。
如果重复的方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果在这两个方法中加入了指定的属性名(或者称为列名),例如:frame.drop_duplicates(['国家']),则指定部分列(列)进行重复项的判断。
<强>具体实例如下:强>
在在在熊猫作为pd导入 在在在data=https://www.yisu.com/zixun/{“状态”:1,1,2,2,“流行”:[a, b, c, d ')} 在在在?pd.DataFrame(数据) 在在在框架 流行国家 0 1 1 b 1 2 c 2 3 d 2 在在在IsDuplicated=frame.duplicated () 在在在打印IsDuplicated 0错误 1假 2错误 3错误 dtype: bool 在在在?frame.drop_duplicates(['国家']) 在在在框架 流行国家 0 1 2 c 2 在在在IsDuplicated=frame.duplicated(['国家']) 在在在打印IsDuplicated 0错误 2错误 dtype: bool 在在在>之前以上这篇Python对多属性的重复数据去重实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
Python对多属性的重复数据去重实例