熊猫如何实现数据的合并与拼接

  介绍

这篇文章将为大家详细讲解有关熊猫如何实现数据的合并与拼接,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。

熊猫包的合并,加入,concat方法可以完成数据的合并和拼接,合并方法主要基于两个dataframe的共同列进行合,并加入方法主要基于两个dataframe的索引进行合并,concat方法是对系列或dataframe进行行拼接或列拼接。

1。合并方法

熊猫的合并方法是基于共同列,将两个dataframe连接起来.merge方法的主要参数:

<李>

左/右:左/右位置的dataframe。

<李>

如何:数据合并的方式.left:基于左dataframe列的数据合并;右:基于右dataframe列的数据合并;外:基于列的数据外合并(取并集);内在:基于列的数据内合并(取交集);默认为& # 39;内部# 39;。

<李>

:用来合并的列名,这个参数需要保证两个dataframe有相同的列名。

<李>

left_on/right_on:左/右dataframe合并的列名,也可为索引,数组和列表。

<李>

left_index/right_index:是否以指数作为数据合并的列名,真表示是。

<李>

:根据dataframe合并排的键序,默认是。

<李>

后缀:若有相同列且该列没有作为合并的列,可通过后缀设置该列的后缀名,一般为元组和列表类型。

合并通过设置有参数选择两个dataframe的连接方式,有内连接,外连接,左连接,右连接,下面通过例子介绍连接的含义。

1.1内连接

=& # 39;如何内部# 39;,dataframe的链接方式为内连接,我们可以理解基于共同列的交集进行连接,参数上设置连接的共有列名。

#,单列的内连接   #,定义df1   import  pandas  as  pd   import  numpy  as  np      df1 =, pd.DataFrame({& # 39;α# 39;:[& # 39;一个# 39;& # 39;b # 39;, & # 39; b # 39;, & # 39; c # 39;, & # 39; d # 39;, & # 39; e # 39;], & # 39; feature1& # 39;: [1, 1, 2, 3, 3, 1],   ,,,,,,,,,,,& # 39;feature2& # 39;:[& # 39;低# 39;& # 39;中等# 39;,& # 39;中等# 39;,& # 39;高# 39;,& # 39;低# 39;,& # 39;高# 39;]})   #,定义df2   df2 =, pd.DataFrame({& # 39;α# 39;:[& # 39;一个# 39;& # 39;一个# 39;,& # 39;b # 39;, & # 39; f # 39;], & # 39; pazham& # 39;:[& # 39;苹果# 39;& # 39;橙色# 39;,& # 39;松# 39;,& # 39;梨# 39;],   ,,,,,,,,,,,& # 39;公斤# 39;:[& # 39;高# 39;& # 39;低# 39;,& # 39;高# 39;,& # 39;中等# 39;],& # 39;价格# 39;:np.array ([5、6、5、7])})   #,打印(df1)   #,打印(df2)   #,基于共同列α的内连接   时间=df3  pd.merge (df1, df2=& # 39;内部# 39;,在=& # 39;α# 39;)   df3

熊猫如何实现数据的合并与拼接

取共同列α值的交集进行连接。

1.2外连接

=& # 39;如何外# 39;,dataframe的链接方式为外连接,我们可以理解基于共同列的并集进行连接,参数上设置连接的共有列名。

#,单列的外连接   #,定义df1   df1 =, pd.DataFrame({& # 39;α# 39;:[& # 39;一个# 39;& # 39;b # 39;, & # 39; b # 39;, & # 39; c # 39;, & # 39; d # 39;, & # 39; e # 39;], & # 39; feature1& # 39;: [1, 1, 2, 3, 3, 1],   ,,,,,,,,,,,,,,,& # 39;feature2& # 39;:[& # 39;低# 39;& # 39;中等# 39;,& # 39;中等# 39;,& # 39;高# 39;,& # 39;低# 39;,& # 39;高# 39;]})   #,定义df2   df2 =, pd.DataFrame({& # 39;α# 39;:[& # 39;一个# 39;& # 39;一个# 39;,& # 39;b # 39;, & # 39; f # 39;], & # 39; pazham& # 39;:[& # 39;苹果# 39;& # 39;橙色# 39;,& # 39;松# 39;,& # 39;梨# 39;],   ,,,,,,,,,,,,,,,,,,,,,,,& # 39;公斤# 39;:[& # 39;高# 39;& # 39;低# 39;,& # 39;高# 39;,& # 39;中等# 39;],& # 39;价格# 39;:np.array ([5、6、5、7])})   #,基于共同列α的内连接   时间=df4  pd.merge (df1, df2=& # 39;外# 39;,在=& # 39;α# 39;)   df4

熊猫如何实现数据的合并与拼接

若两个dataframe间除了上设置的连接列外并无相同列,则该列的值置为NaN。

1.3左连接

=& # 39;如何左# 39;,dataframe的链接方式为左连接,我们可以理解基于左边位置dataframe的列进行连接,参数上设置连接的共有列名。

#,单列的左连接   #,定义df1   df1 =, pd.DataFrame({& # 39;α# 39;:[& # 39;一个# 39;& # 39;b # 39;, & # 39; b # 39;, & # 39; c # 39;, & # 39; d # 39;, & # 39; e # 39;], & # 39; feature1& # 39;: [1, 1, 2, 3, 3, 1],   ,,,& # 39;feature2& # 39;:[& # 39;低# 39;& # 39;中等# 39;,& # 39;中等# 39;,& # 39;高# 39;,& # 39;低# 39;,& # 39;高# 39;]})   #,定义df2   df2 =, pd.DataFrame({& # 39;α# 39;:[& # 39;一个# 39;& # 39;一个# 39;,& # 39;b # 39;, & # 39; f # 39;], & # 39; pazham& # 39;:[& # 39;苹果# 39;& # 39;橙色# 39;,& # 39;松# 39;,& # 39;梨# 39;],   ,,,,,,,,,,,,,,,,,,,,,,,& # 39;公斤# 39;:[& # 39;高# 39;& # 39;低# 39;,& # 39;高# 39;,& # 39;中等# 39;],& # 39;价格# 39;:np.array ([5、6、5、7])})   #,基于共同列α的左连接   时间=df5  pd.merge (df1, df2=& # 39;左# 39;,在=& # 39;α# 39;)   df5

熊猫如何实现数据的合并与拼接