利用熊猫怎么对行列的数据进行抽取

  介绍

今天就跟大家聊聊有关利用熊猫怎么对行列的数据进行抽取,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

取行和列的几种常用方式:

数据列(名):取单列或多列,不能用连续方式取,也不能用于取行。
数据。列名:只用于取单列,不能用于行。
数据(i, j):用起始行下标(i)和终止行下标(j)取单行或者连续多行,不能用于列的选取。
数据。代码行(行名,列名]:用对象的.loc[]方法实现各种取数据方式。
数据。iloc[行下标,列下标):用对象的。iloc[]方法实现各种取数据方式。

首先生成一个DataFrame对象:

import  pandas  as  pd   score =, [[34、67、87], [68、98、58], [75、73、86], [94、59、81]]   name =,(& # 39;小新& # 39;,& # 39;小红& # 39;,& # 39;小李& # 39;】   course =,(& # 39;语文& # 39;,& # 39;数学& # 39;,& # 39;英语& # 39;,& # 39;政治& # 39;】   时间=mydata  pd.DataFrame (==https://www.yisu.com/zixun/score的数据,列名称,索引=)#指定行列名   打印(mydata)

小新,小红,小李
语文,34岁,67年,87年
数学,68年,98年,58
英语,75年,73年,86年
政治,94年,59,81年

1。直接用列名抽取单列或多列-数据(列名]

打印(mydata[& # 39;小红& # 39;]),#,输出是一个系列的对象,而不是DataFrame对象   语文,67年   数学,98年   英语,73年   政治,59岁,      print (mydata[[& # 39;小红& # 39;]]),#,加了[],此时输出的是DataFrame对象   ,小红   语文,67年   数学,98年   英语,73年   政治59      print (mydata[[& # 39;小红& # 39;,& # 39;小李& # 39;]]),#选择两列,此时必须用[]将两列括起来   ,小红,小李   语文,67,87   数学,98年,58岁   英语,73,86   政治,59,81

2。用行所在矩阵索引抽取一个行或者连续多行数据

打印(mydata(0:1)), #通过0:1选择了第0行   ,小新,小红,小李   语文,34岁,67年,87年      mydata(0:3), #通过0:3选择了第0、1、2三行   ,小新,小红,小李   语文,34岁,67年,87年   数学,68年,98年,58岁   英语,75,73,86

3。用数据的“·”方式获取某一列数据

打印(mydata。小红),#通过。小红选择了小红列,注意输出的是系列对象   语文,67年   数学,98年   英语,73年   政治,59

4。面糊中利用DataFrame对象的.loc [,]。iloc[,]方法抽取数据

引例:

import  pandas  as  pd   score =, [[34、67、87], [68、98、58], [75、73、86], [94、59、81]]   name =,(& # 39;小新& # 39;,& # 39;小红& # 39;,& # 39;小李& # 39;】   course =,(& # 39;语文& # 39;,& # 39;数学& # 39;,& # 39;英语& # 39;,& # 39;政治& # 39;】   时间=mydata1  pd.DataFrame (==https://www.yisu.com/zixun/score的数据,列名称,索引=)#指定行名(索引)和列名(列)   打印(mydata1)   mydata2=pd.DataFrame(分数)#不指定行列名,默认使用0、1、2……   打印(mydata2)

,,,小明,小红,小李
语文,34岁,67年,87年
数学,68年,98年,58
英语,75年,73年,86年
政治,94年,59,81年
,,,0,,1,,2
0,34岁,67年,87
1,68年,98年,58
2,75年,73年,86
3,94年,59,81年

DataFrame对象的.loc[]和。iloc[]方法都可用于抽取数据,区别是:

<李>

。loc[]:以列名和行名作为参数。

<李>

。iloc[]:以二维矩阵的位置指标(即0、1、2……)作为参数。

<强> .loc[]语法:

有两个输入参数,第一个指定行名,第二个指定列名。当只有一个参数时,默认是行名(即抽取整行),所有列都选中。

<强> .iloc[]语法:

有两个输入参数,第一个指定行位置,第二个指定列位置。当只有一个参数时,默认是行位置(即抽取整行),所有列都选中。

总结:

当需要选中所有行的某几列时,行参数可以省略,列参数需要指定,此时列参数前面必须带上”,:“,形如.loc(:,列参数),。iloc[:列参数]。

两种方法当只指定一个输入参数时,都默是跟“行”相关,而“列”则全部被选中。如何行和列都需要指定时,中间用“逗号,“隔开,这非常重要,否则出错。

两个方法都接受两个参数,第一个是“行标签”或者“矩阵行号”,第二个是“列标签”或者“矩阵列号”。

利用熊猫怎么对行列的数据进行抽取