资讯专栏INFORMATION COLUMN

pandas concat ignore_index 无效,依然保留索引

zhaochunqi / 4226人阅读

摘要:最后的解决方法是先删除索引,再进行合并。。。原因并不意味忽略然后连接,而是指连接后再重新赋值。从上面可以看出如果两个有重叠的索引还是可以自动合并的。原解释忽略,表示未在连接轴上对齐。

假设现在有两个数据:
df1
    0 1 2 3
a 5.1 4.7 4.9 2.4
b 3.0 3.2 3.0 6.2
c 4.5 1.3 2.7 1.8
d 1.4 1.9 1.4 0.5
e 0.2 0.2 0.2 3.5
newdf
    0 1 2 3
0 10 45 13 1
1 47 15 46 42
2 38 26 20 11
3 9 16 44 23
4 45 6 24 35
 使用concat合并,设置参数axis=1ignore_index=True
pd.concat([df1,newdf],axis=1,ignore_index=True)
    0 1 2 3 4 5 6 7
a 5.1 4.7 4.9 2.4 NaN NaN NaN NaN
b 3.0 3.2 3.0 6.2 NaN NaN NaN NaN
c 4.5 1.3 2.7 1.8 NaN NaN NaN NaN
d 1.4 1.9 1.4 0.5 NaN NaN NaN NaN
e 0.2 0.2 0.2 3.5 NaN NaN NaN NaN
0 NaN NaN NaN NaN 10.0 45.0 13.0 1.0
1 NaN NaN NaN NaN 47.0 15.0 46.0 42.0
2 NaN NaN NaN NaN 38.0 26.0 20.0 11.0
3 NaN NaN NaN NaN 9.0 16.0 44.0 23.0
4 NaN NaN NaN NaN 45.0 6.0 24.0 35.0
但是参数设置为axis=0的时候有效,列表成功合并,而且index的确被忽略了。
pd.concat([df1,newdf],axis=0,ignore_index=True)
    0   1   2   3
0 5.1 4.7 4.9 2.4
1 3.0 3.2 3.0 6.2
2 4.5 1.3 2.7 1.8
3 1.4 1.9 1.4 0.5
4 0.2 0.2 0.2 3.5
5 10.0 45.0 13.0 1.0
6 47.0 15.0 46.0 42.0
7 38.0 26.0 20.0 11.0
8 9.0 16.0 44.0 23.0
9 45.0 6.0 24.0 35.0
最后的解决方法是先删除索引,再进行合并。。。
df1.reset_index(drop=True, inplace=True)
df2.reset_index(drop=True, inplace=True)
 原因
ignore_index = True并不意味忽略index然后连接,而是指连接后再重新赋值index(len(index))。从上面可以看出如果两个df有重叠的索引还是可以自动合并的。

原解释

ignore_index = True"忽略",表示未在连接轴上对齐。它只是按它们传递的顺序将它们粘贴在一起,然后重新分配实际索引的范围(例如,范围(len(索引))),以便加入非重叠索引之间的差异(假设示例中的轴= 1)是,使用ignore_index = False(默认值),您获得索引的concat,并使用ignore_index = True获得范围。

参考:
pandas concat ignore_index doesn"t work

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/41894.html

相关文章

  • 关于合并python DataFrame的方法总结

      小编写这篇文章的主要目的,主要是给大家做个详细的解答,详细的解答关于python DataFrame相关方面的知识,希望可以为各位读者带来更多的帮助。  python DataFrame的合并方法  Python的Pandas针对DataFrame,Series提供了多个合并函数,通过参数的调整可以轻松实现DatafFrame的合并。  首先,定义3个DataFrame df1,df2,df3...

    89542767 评论0 收藏0
  • ❤️数据科学-Pandas、Numpy、Matplotlib秘籍之精炼总结

    前言: 先感受一下数据科学的魅力,上图是在Smart Dubai 2017 GITEX科技周展台上推出Smart Decision-Making Platform(智能决策平台),于10月8日至12日在迪拜世界贸易中心举行。游客可以通过一个沉浸式的空间将数据可视化,让他们了解迪拜的未来。让参观者可以在现场查阅观看全市数据,这意味着迪拜将成为了世界上第一个与公众分享实时实时数据的城市,同时还可以预...

    Zhuxy 评论0 收藏0
  • python综合学习五之Pandas

    摘要:后者选择到标签之间的数据,并且包括这两个标签。根据位置设置和我们可以利用索引或者标签确定需要修改值的位置。通过上边的学习,我们学会了如何对中在自己想要的地方赋值或者增加数据。 这一节,主要深入学习Pandas的用法。 一、筛选 先建立一个 6X4 的矩阵数据。 dates = pd.date_range(20180830, periods=6) df = pd.DataFrame(np...

    Miracle 评论0 收藏0
  • 【数据科学系统学习】Python # 数据分析基本操作[四] 数据规整化和数据聚合与分组运算

    摘要:数据规整化清理转换合并重塑数据聚合与分组运算数据规整化清理转换合并重塑合并数据集可根据一个或多个键将不同中的行链接起来。函数根据样本分位数对数据进行面元划分。字典或,给出待分组轴上的值与分组名之间的对应关系。 本篇内容为整理《利用Python进行数据分析》,博主使用代码为 Python3,部分内容和书本有出入。 在前几篇中我们介绍了 NumPy、pandas、matplotlib 三个...

    The question 评论0 收藏0

发表评论

0条评论

zhaochunqi

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<