摘要:本文主要是讲解一下,如何进行排序。分为两种情况,不分组进行排序和组内进行排序。什么意思呢?具体来说,我举个栗子。
如果只是单纯想对某一列进行排序,而不进行打序号的话直接使用.sort_values就可以了。下文是关于如何把序号也打上的
- - - - - - - - - - - - - - - - - - - - - - - - - - - - -
<强>我们有一个数据集如下:强>
我们下面想进行两种排序。先说第一种比较简单的也是很常用的,简单的对某一列进行排序然后添加一列序号。
例如,我们队comment_num这一列进行从大到小的排序,然后给出序号。如下图:
可以看的到,sort_num这一列就是我们队comment_num的排序。
<>强如何实现呢?很简单,代码如下(数据集为数据):强>
数据[' sort_num ']=[' comment_num '] .rank(提升=0,方法=懊芗? >之前这里,我们用到了两个参数,第一个很好理解提升,就是选择是升序还是降序排列。
另外一个参数方法,这个参数很重要。我下面详细讲一下。
有时候,我们排序的时候会遇到相同大小,这个时候怎么处理呢?其方法实就是让我们选择如何处理。
<强>第一种情况,>强如果出现相等,则序号一样,之后序号照常递增。这种情况就是上图的,我们看到comment_num等于4的有2个,序号为1. comment_num等于3的时候,序号为2,这个叫做正常按1依次递增。这和时候方法=懊芗?/p>
<强>第二种情况,>强如果出现相等,则取最先出现的值序号为“最小”,其他相同值依次按1递增,如果把上面代码方法=谝淮巍?就是实现这种效果,效果如下图:
数据[' sort_num ']=[' comment_num '] .rank(提升=0,方法='第一次')
comment_num中4最大,并且第1行中4的最先出现,故序号为1 .
第三种情况和第四种情况比较复杂。文字不好说明,下面直接放代码和效果。
当方法=胺种印笔?/p>
数据[' sort_num ']=[' comment_num '] .rank(提升=0,方法=白钚≈怠?
当方法=癿ax”时
数据[' sort_num ']=[' comment_num '] .rank(提升=0,方法=癿ax”)
上面只是某一列的排序、下面是组内排序。什么是意思?同样看下面的例子
假如,我想对美食为7的comment_num进行排序,同样也对,美食为8的comment_num进行排序。也就是说,对comment_num排序的时候,只考虑相同的美食,这个就是对组内进行排序。
<>强实现的效果应该如下图:强>
实现代码也很简单。
数据[' group_sort ']=[' comment_num '] .groupby(数据['美食']).rank(提升=0,方法=懊芗? >之前以上这篇python熊猫组内排的序,单组排序,标号的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
python熊猫组内排的序,单组排序,标号的实例