Python对多属性的重复数据去重实例 - 行业资讯 - 肥雀云

1)利用DataFrame中的重复的方法返回一个布尔型的系列,显示各行是否有重复行,没有重复行显示为假,有重复行显示为真;

2)再利用DataFrame中的drop_duplicates方法用于返回一个移除了重复行的DataFrame。

如果重复的方法和drop_duplicates方法中没有设置参数,则这两个方法默认会判断全部咧,如果在这两个方法中加入了指定的属性名(或者称为列名),例如:frame.drop_duplicates(['国家']),则指定部分列(列)进行重复项的判断。

<强>具体实例如下:

　　　　　　在在在熊猫作为pd导入　　在在在data=https://www.yisu.com/zixun/{“状态”:1,1,2,2,“流行”:[a, b, c, d ')} 　　在在在?pd.DataFrame(数据) 　　在在在框架　　流行国家　　0 1 　　1 b 1 　　2 c 2 　　3 d 2 　　在在在IsDuplicated=frame.duplicated () 　　在在在打印IsDuplicated 　　0错误　　1假　　2错误　　3错误　　dtype: bool 　　在在在?frame.drop_duplicates(['国家']) 　　在在在框架　　流行国家　　0 1 　　2 c 2 　　在在在IsDuplicated=frame.duplicated(['国家']) 　　在在在打印IsDuplicated 　　0错误　　2错误　　dtype: bool 　　在在在之前　　　　

以上这篇Python对多属性的重复数据去重实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。