资讯专栏INFORMATION COLUMN

pandas中聚合函数agg的具体用法

89542767 / 790人阅读

  pandas其实汇集了python函数的一个数据库,主要是用来调用数据的,作为其中的聚合函数,那么,其中的函数agg的具体用法是怎么样的呢?下面就给大家详细的解答下。


  今天看到pandas的聚合函数agg,比较陌生,平时的工作中处理数据的时候使用的也比较少,为了加深印象,总结一下使用的方法,其实还是挺好用的。


  DataFrame.agg(func,axis=0,*args,**kwargs)


  func:函数,函数名称,函数列表,字典{‘行名/列名’,‘函数名’}


  使用指定轴上的一个或多个操作进行聚合。

01.png

  agg是一个聚合函数,聚合函数操作始终是在轴(默认是列轴,也可设置行轴)上执行,不同于numpy聚合函数


  (np.sum()//求和;np.prod()//所有元素相乘;np.mean()//平均值;np.std()//标准差;np.var()//方差;np.median()//中数;np.power()//幂运算;np.sqrt()//开方;np.min()//最小值;np.max()//最大值;np.argmin()//最小值的下标;np.argmax()//最大值的下标;np.inf//无穷大;np.exp(10)//以e为底的指数;np.log(10)//对数)


  下面示例展示agg具体用法:


  定义一个列表值:


  import pandasas pd
  df=pd.DataFrame([[1,2,3,4],
  [11,22,33,44],
  [111,222,333,444],
  [1111,2222,3333,4444]
  ],
  columns=['col1','col2','col3','col4'],)#列名
  print(df)

02.png

  在行上聚合这些函数


  df_arows=df.agg(['max','min','mean'])
  col1 col2 col3 col4
  max 1111.0 2222.0 3333.0 4444.0
  min 1.0 2.0 3.0 4.0
  mean 308.5 617.0 925.5 1234.0

03.png

  每列不同的聚合


  df_columns=df.agg({'col1':['sum','min'],'col2':['max','min'],'col3':['sum','min']})
  col1 col2 col3
  max NaN 2222.0 NaN
  min 1.0 2.0 3.0
  sum 1234.0 NaN 3702.0

04.png

  注:当某列没有其他聚合函数时,则用NaN填充。


  总结


  综上所述,这篇文章就给大家介绍到这里了,希望可以给各位读者带来帮助。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/128352.html

相关文章

  • python处理数据风骚操作[pandas 之 groupby&agg]

    摘要:最后使用聚合函数,就得到了结果。从实现上看,返回的是一个结构,这个结构必须调用聚合函数如之后,才会得到结构为的数据结果。 介绍 每隔一段时间我都会去学习、回顾一下python中的新函数、新操作。这对于你后面的工作是有一定好处的。本文重点介绍了pandas中groupby、Grouper和agg函数的使用。这2个函数作用类似,都是对数据集中的一类属性进行聚合操作,比如统计一个用户在每个月...

    paraller 评论0 收藏0
  • 【数据科学系统学习】Python # 数据分析基本操作[四] 数据规整化和数据聚合与分组运算

    摘要:数据规整化清理转换合并重塑数据聚合与分组运算数据规整化清理转换合并重塑合并数据集可根据一个或多个键将不同中的行链接起来。函数根据样本分位数对数据进行面元划分。字典或,给出待分组轴上的值与分组名之间的对应关系。 本篇内容为整理《利用Python进行数据分析》,博主使用代码为 Python3,部分内容和书本有出入。 在前几篇中我们介绍了 NumPy、pandas、matplotlib 三个...

    The question 评论0 收藏0
  • Python数据分析学习笔记之Pandas入门

    摘要:是一个数据分析的开源库。与表格或关系数据库中的表非常神似。注意带有一个索引,类似于关系数据库中的主键。的统计函数分组与聚合通过方法,可以对数据组施加一系列的函数。函数的作用是串联,追加数据行使用函数。 pandas(Python data analysis)是一个Python数据分析的开源库。pandas两种数据结构:DataFrame和Series 安装:pandas依赖于NumPy...

    zqhxuyuan 评论0 收藏0
  • Python数据分析入门之pandas总结基础(二)

    摘要:一大熊猫世界来去自如的老生常谈,从基础来看,我们仍然关心对于与外部数据是如何交互的。函数受限制问题唯一重要的参数,标志着一个的第个页将会被取出。数据分析入门之总结基础一欢迎来翔的博客查看完成版。 一.大熊猫世界来去自如:Pandas的I/O 老生常谈,从基础来看,我们仍然关心pandas对于与外部数据是如何交互的。 1.1 结构化数据输入输出 read_csv与to_csv 是⼀对...

    verano 评论0 收藏0
  • Pandas使用DataFrame进行数据分析比赛进阶之路(一)

    摘要:按照某一列的数值进行排序后输出。根据国籍这一列的属性进行分组,然后分别计算相同国籍的潜力的平均值。值得注意的是,在分组函数后面使用一个函数可以返回带有分组大小的结果。 这篇文章中使用的数据集是一个足球球员各项技能及其身价的csv表,包含了60多个字段。数据集下载链接:数据集 1、DataFrame.info() 这个函数可以输出读入表格的一些具体信息。这对于加快数据预处理非常有帮助。 ...

    yeooo 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<