今天就跟大家聊聊有关利用熊猫怎么对行列的数据进行抽取,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
取行和列的几种常用方式:
数据列(名):取单列或多列,不能用连续方式取,也不能用于取行。
数据。列名:只用于取单列,不能用于行。
数据(i, j):用起始行下标(i)和终止行下标(j)取单行或者连续多行,不能用于列的选取。
数据。代码行(行名,列名]:用对象的.loc[]方法实现各种取数据方式。
数据。iloc[行下标,列下标):用对象的。iloc[]方法实现各种取数据方式。
首先生成一个DataFrame对象:
import pandas as pd score =, [[34、67、87], [68、98、58], [75、73、86], [94、59、81]] name =,(& # 39;小新& # 39;,& # 39;小红& # 39;,& # 39;小李& # 39;】 course =,(& # 39;语文& # 39;,& # 39;数学& # 39;,& # 39;英语& # 39;,& # 39;政治& # 39;】 时间=mydata pd.DataFrame (==https://www.yisu.com/zixun/score的数据,列名称,索引=)#指定行列名 打印(mydata)
小新,小红,小李
引用>
语文,34岁,67年,87年
数学,68年,98年,58
英语,75年,73年,86年
政治,94年,59,81年
1。直接用列名抽取单列或多列-数据(列名]
打印(mydata[& # 39;小红& # 39;]),#,输出是一个系列的对象,而不是DataFrame对象 语文,67年 数学,98年 英语,73年 政治,59岁, print (mydata[[& # 39;小红& # 39;]]),#,加了[],此时输出的是DataFrame对象 ,小红 语文,67年 数学,98年 英语,73年 政治59 print (mydata[[& # 39;小红& # 39;,& # 39;小李& # 39;]]),#选择两列,此时必须用[]将两列括起来 ,小红,小李 语文,67,87 数学,98年,58岁 英语,73,86 政治,59,812。用行所在矩阵索引抽取一个行或者连续多行数据
打印(mydata(0:1)), #通过0:1选择了第0行 ,小新,小红,小李 语文,34岁,67年,87年 mydata(0:3), #通过0:3选择了第0、1、2三行 ,小新,小红,小李 语文,34岁,67年,87年 数学,68年,98年,58岁 英语,75,73,863。用数据的“·”方式获取某一列数据
打印(mydata。小红),#通过。小红选择了小红列,注意输出的是系列对象 语文,67年 数学,98年 英语,73年 政治,594。面糊中利用DataFrame对象的.loc [,]。iloc[,]方法抽取数据
引例:
import pandas as pd score =, [[34、67、87], [68、98、58], [75、73、86], [94、59、81]] name =,(& # 39;小新& # 39;,& # 39;小红& # 39;,& # 39;小李& # 39;】 course =,(& # 39;语文& # 39;,& # 39;数学& # 39;,& # 39;英语& # 39;,& # 39;政治& # 39;】 时间=mydata1 pd.DataFrame (==https://www.yisu.com/zixun/score的数据,列名称,索引=)#指定行名(索引)和列名(列) 打印(mydata1) mydata2=pd.DataFrame(分数)#不指定行列名,默认使用0、1、2…… 打印(mydata2),,,小明,小红,小李
引用>
语文,34岁,67年,87年
数学,68年,98年,58
英语,75年,73年,86年
政治,94年,59,81年
,,,0,,1,,2
0,34岁,67年,87
1,68年,98年,58
2,75年,73年,86
3,94年,59,81年
DataFrame对象的.loc[]和。iloc[]方法都可用于抽取数据,区别是:
<李>
。loc[]:以列名和行名作为参数。
李> <李>。iloc[]:以二维矩阵的位置指标(即0、1、2……)作为参数。
李><强> .loc[]语法:强>
有两个输入参数,第一个指定行名,第二个指定列名。当只有一个参数时,默认是行名(即抽取整行),所有列都选中。
<强> .iloc[]语法:强>
有两个输入参数,第一个指定行位置,第二个指定列位置。当只有一个参数时,默认是行位置(即抽取整行),所有列都选中。
总结:
当需要选中所有行的某几列时,行参数可以省略,列参数需要指定,此时列参数前面必须带上”,:“,形如.loc(:,列参数),。iloc[:列参数]。
两种方法当只指定一个输入参数时,都默是跟“行”相关,而“列”则全部被选中。如何行和列都需要指定时,中间用“逗号,“隔开,这非常重要,否则出错。
两个方法都接受两个参数,第一个是“行标签”或者“矩阵行号”,第二个是“列标签”或者“矩阵列号”。
利用熊猫怎么对行列的数据进行抽取