小编写这篇文章的主要目的,主要是给大家做个详细的解答,详细的解答关于python DataFrame相关方面的知识,希望可以为各位读者带来更多的帮助。
python DataFrame的合并方法
Python的Pandas针对DataFrame,Series提供了多个合并函数,通过参数的调整可以轻松实现DatafFrame的合并。
首先,定义3个DataFrame df1,df2,df3,进行concat、merge、append函数的实验。
df1=pd.DataFrame([[1,2,3],[2,3,4]],columns=['a','b','c']) df2=pd.DataFrame([[2,3,4],[3,4,5]],columns=['a','b','c']) df3=pd.DataFrame([[1,2,3],[2,3,4]],columns=['a','b','d']) df1 a b c 0 1 2 3 1 2 3 4 df2 a b c 0 2 3 4 1 3 4 5 df3 a b d 0 1 2 3 1 2 3 4
#concat函数
pandas中concat函数的完整表达,包含多个参数,常用的有axis,join,ignore_index.
concat函数的第一个参数为objs,一般为一个list列表,包含要合并两个或多个DataFrame,多个Series
pandas.concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False, keys=None,levels=None,names=None,verify_integrity=False, copy=True)
1.axis表示合并方向,默认axis=0,两个DataFrame按照索引方向纵向合并,axis=1则会按照columns横向合并。
pd.concat([df1,df2],axis=1) a b c a b c 0 1 2 3 2 3 4 1 2 3 4 3 4 5
2.join表示合并方式,默认join=‘outer’,另外的取值为’inner’,只合并相同的部分,axis=0时合并结果为相同列名的数据,axis=1时为具有相同索引的数据
pd.concat([df2,df3],axis=0,join='inner') a b 0 2 3 1 3 4 0 1 2 1 2 3 pd.concat([df2,df3],axis=1,join='inner') a b c a b d 0 2 3 4 1 2 3 1 3 4 5 2 3 4
3.ignore_index表示索引的合并方式,默认为False,会保留原df的索引,如果设置ignore_index=True,合并后的df会重置索引。
pd.concat([df1,df2],ignore_index=True) a b c 0 1 2 3 1 2 3 4 2 2 3 4 3 3 4 5
#merge函数
merge函数是pandas提供的一种数据库式的合并方法。
on可以指定合并的列、索引,how则是与数据库join函数相似,取值为left,right,outer,inner.left,right分别对应left outer join,right outer join.
pandas.merge(left,right,how='inner',on=None,left_on=None,right_on=None, left_index=False,right_index=False,sort=False, suffixes=('_x','_y'),copy=True,indicator=False, validate=None):
merge函数可以通过pandas.merge(df1,df2)、df1.merge(df2)两种形式来实现两个DataFrame的合并,df1.merge(df2)是默认left=self的情况。
df_merge=df1.merge(df3,on=['a','b']) a b c d 0 1 2 3 3 1 2 3 4 4
#append函数
append函数是pandas针对DataFrame、Series等数据结构合并提供的函数。
df1.append(self,other,ignore_index=False,verify_integrity=False)
df1.append(df2)与pd.concat([df1,df2],ignore_index=False)具有相同的合并结果
df1.append(df2) a b c 0 1 2 3 1 2 3 4 0 2 3 4 1 3 4 5
把两个dataframe合并成一个
merage
result=pd.merge(对象1,对象2,on='key')
2.append
result=df1.append(df2) result=df1.append([df2,df3]) result=df1.append(df4,ignore_index=True)
3.join
result=left.join(right,on=['key1','key2'],how='inner')
4.concat
pd.concat(objs,axis=0,join='outer',join_axes=None,ignore_index=False, keys=None,levels=None,names=None,verify_integrity=False, copy=True) frames=[df1,df2,df3] result=pd.concat(frames) result=pd.concat(frames,keys=['x','y','z']) result=pd.concat([df1,df4],ignore_index=True)
上文就为大家介绍完毕了,希望能给大家带来一定的帮助。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/127776.html
摘要:一基础运算二通过上一节的学习,我们可以了解到一部分矩阵中元素的计算和查找操作。相应的,在矩阵的个元素中,最小值即,对应索引,最大值为,对应索引为。确认是否与相同。要使用,首先需要了解他主要两个数据结构和。 这一节继续学习Numpy和Pandas。 一、numpy基础运算二 通过上一节的学习,我们可以了解到一部分矩阵中元素的计算和查找操作。然而在日常使用中,对应元素的索引也是非常重要的。...
摘要:数据规整化清理转换合并重塑数据聚合与分组运算数据规整化清理转换合并重塑合并数据集可根据一个或多个键将不同中的行链接起来。函数根据样本分位数对数据进行面元划分。字典或,给出待分组轴上的值与分组名之间的对应关系。 本篇内容为整理《利用Python进行数据分析》,博主使用代码为 Python3,部分内容和书本有出入。 在前几篇中我们介绍了 NumPy、pandas、matplotlib 三个...
摘要:在这些情况下,了解如何从标准列表或字典创建会很有帮助。大多数人会注意到列的顺序看起来不对。这个问题出现的原因是标准的字典不保留其键的顺序。列表从创建的另一个选择是将数据包含在列表结构中。 介绍 每当我使用pandas进行分析时,我的第一个目标是使用众多可用选项中的一个将数据导入Pandas的DataFrame 。对于绝大多数情况下,我使用的 read_excel , read_csv ...
摘要:查看数据的基本统计信息。用处是用于数据读写处理更改提取等一系列操作的包,可以说,所有能实现的功能,都可以通过代码轻松实现,因此,对于学习非常重要。如果在里,需要翻到最低和最右,而且可能由于溢出无法穷尽可以简单的实现。 放在前面的话 这学期刻意少...
阅读 908·2023-01-14 11:38
阅读 874·2023-01-14 11:04
阅读 737·2023-01-14 10:48
阅读 1971·2023-01-14 10:34
阅读 939·2023-01-14 10:24
阅读 817·2023-01-14 10:18
阅读 495·2023-01-14 10:09
阅读 569·2023-01-14 10:02