熊猫使用这些函数处理缺失值:
-
<李> isnull和notnull:检测是否是空值,可用于df系列和李>
<李> dropna:丢弃,删除缺失值
-
<李>轴:删除行还是列,{1 0或“指数”,或“列”},默认0 李>
<李>如何:如果等于任何则任何值为空都删除,如果等于所有则所有值都为空才删除李>
<李>原地:如果为真则修改当前df,否则返回新的df李>
-
<李>价值:用于填充的值,可以是单个值,或者字典(关键是列名,价值是值)李>
<李>方法:等于ffill使用前一个不为空的值填充丰华填补;等于bfill使用后一个不为空的值填充向后制定填补李>
<李>轴:按行还是列填充,{1 0或“指数”,或“列”}李>
<李>原地:如果为真则修改当前df,否则返回新的df李>
熊猫作为pd >之前导入
步骤1:读取excel的时候,忽略前几个空行
studf=pd.read_excel(”。/数据/student_excel/student_excel。xlsx”, skiprows=2)studf姓名:0 姓名 科目 分数 0 南 小明 语文 85.0 1 南 南 数学 80.0 2 南 南 英语 90.0 3. 南 南 南 南 4 南 小王 语文 85.0 5 南 南 数学 南 6 南 南 英语 90.0 7 南 南 南 南 8 南 小刚 语文 85.0 9 南 南 数学 80.0 10 南 南 英语 90.0
<强>步骤2:检测空值
强>studf.isnull ()姓名:0 姓名 科目 分数 0 真正的 假 假 假 1 真正的 真正的 假 假 2 真正的 真正的 假 假 3. 真正的 真正的 真正的 真正的 4 真正的 假 假 假 5 真正的 真正的 假 真正的 6 真正的 真正的 假 假 7 真正的 真正的 真正的 真正的 8 真正的 假 假 假 9 真正的 真正的 假 假 10 真正的 真正的 假 假
studf["分数"].isnull ()0错误 1假 2错误 3真正的 4错误 5真 6错误 7真的 8错 9日假 10个假 名称:分数,dtype: boolstudf["分数"].notnull ()0真实 1真正的 2真 3错误 4真 5假 6真实 7假 八个真正 9真实 10真实 名称:分数,dtype: bool#筛选没有空分数的所有行 studf.loc [studf[“分数"].notnull ():]姓名:0 姓名 科目 分数 0 南 小明 语文 85.0 1 南 南 数学 80.0 2 南 南 英语 90.0 4 南 小王 语文 85.0 6 南 南 英语 90.0 8 南 小刚 语文 85.0 9 南 南 数学 80.0 10 南 南 英语 90.0
Python熊猫对缺失值的处理方法