熊猫怎样去掉,过滤数据集中的某些值或者某些行

介绍

小编给大家分享一下熊猫怎样去掉,过滤数据集中的某些值或者某些行,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获、下面让我们一起去了解一下吧!

摘要在进行数据分析与清理中,我们可能常常需要在数据集中去掉某些异常值。具体来说,看看下面的例子。

熊猫怎样去掉,过滤数据集中的某些值或者某些行“> <br/> </p> <p> <强> 0。导入我们需要使用的包</强> </p> <p> <代码>熊猫作为pd导入</代码> </p> <p>熊猫是很常用的数据分析,数据处理的包.anaconda已经有这个包了,纯净版python的可以自行pip安装。<br/> </p> <p> <强> 1。去掉某些具体值</强> </p> <p>数据集df中,对于属性appPlatform(最后一列),我们想删除掉取值为2的那些样本。如何做?非常简单。</p> <p> <代码>熊猫作为pd导入</代码> </p> <pre类= df ((True-df [& # 39; appPlatform& # 39;] .isin ([2])))

熊猫怎样去掉,过滤数据集中的某些值或者某些行“> <br/> </p> <p>当然,有时候我们需要去掉不止一个值,这个时候只需要在型号([])的列表中添加。更具体来说,例如,对于appID这个属性,我们想去掉appID=278和appID=382的样本。</p> <pre类= df ((True-df [& # 39; appID& # 39;] .isin ([278382])))

熊猫怎样去掉,过滤数据集中的某些值或者某些行“> <br/> </p> <p>另外,我们有时候并不只是考虑某一列,还需要考虑另外若干列的情况,例如,我们需要过滤掉appPlatform=2而且appID=278和appID=382的样本呢?非常简单。</p> <pre类= df ((True-df [& # 39; appID& # 39;] .isin ([278382])), (True-df [& # 39; appPlatform& # 39;] .isin ([2])))

其实,在这里我们看的到,就是由两部分组成的,第一部分就是appID中等于278年和382年的,另外一部分就是appPlatform中等于2的。两者取逻辑关系与(和)

熊猫怎样去掉,过滤数据集中的某些值或者某些行“> <br/> </p> <p> <强> 2。过滤掉某个范围的值</强> </p> <p>上面我们是了解了如何取掉某个具体值、下面,我们要看看如何过滤掉某个范围的值。对于数据集df,我们想过滤掉creativeID(第一列)中ID值大于10000的样本。</p> <pre类= df (df (& # 39; creativeID& # 39;] & lt;=10000]

熊猫怎样去掉,过滤数据集中的某些值或者某些行“> <br/> </p> <p>另外,如果要考虑多列的话,其实和上面一样,将两种情况做逻辑与(,)就可以,不过值得注意的是,每个条件要用括号()括起来。</p> <p class=以上是“熊猫怎样去掉,过滤数据集中的某些值或者某些行”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注行业资讯频道!

熊猫怎样去掉,过滤数据集中的某些值或者某些行