资讯专栏INFORMATION COLUMN

Python数据分析工具pandas

ernest.wang / 563人阅读

摘要:一关于是基于构建,经许可的开源库,为开发者提供高性能,易用的数据结构和数据分析工具。官网二数据结构一维标记的数组,能够保存任何数据类型整数,字符串,浮点数,对象等。轴标签统称为索引。二维的表格型数据结构。

一、关于pandas

pandas是基于NumPy构建,经BSD许可的开源库,为Python开发者提供高性能,易用的数据结构和数据分析工具。pandas官网

二、数据结构

1、Series:一维标记的数组,能够保存任何数据类型(整数,字符串,浮点数,Python对象等)。轴标签统称为索引。

import pandas as pd
import numpy as np

# 传入数据可以是 ndarray或列表,
# 此时传入index时,需要满足len(index)=len(data)
# data = np.random.randn(4)
# data = ["a",2,3.1,True]
# 传入数据可以是 标量值
# data = 6
# 传入数据可以是 字典
data = {"b":1,"a":6,"c":15}
# 如果没有传递index或index=None,将自动创建index=[0, ..., len(data) - 1]。
index = ["a", "b", "c", "d", "e"]
# 创建 Series
s = pd.Series(data,index=index,name="my_series")
print(s)
# a    6.0
# b    1.0
# c    15.0
# d    NaN  --> pandas缺失数据标记
# e    NaN
# Name: my_series, dtype: float64
# Series切片操作
print(s[0]) # 6.0

print(s[:2])
# a    6.0
# b    1.0
# Name: my_series, dtype: float64

print(s[[1,4]])
# b    1.0
# e    NaN
# Name: my_series, dtype: float64

# Series类似字典操作
print(s["d"]) # nan
s["d"] = 2 # 设置指定index的值
print(s["d"]) # 2.0

print("e" in s) # True,判断是否含有指定index
# print(s["f"]) # KeyError: "f"
print(s.get("f", np.nan)) # 类似字典get取值

print(s.name) # my_series 获取name
print(s.index) # Index(["a", "b", "c", "d", "e"], dtype="object")

2、Time- Series:以时间为索引的Series。
3、DataFrame:二维的表格型数据结构。很多功能与R中的data.frame类似。可以将DataFrame理解为Series的容器。
4、Panel :三维的数组,可以理解为DataFrame的容器。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/42718.html

相关文章

  • Python 和 R 数据分析/挖掘工具互查

    摘要:写在前面在此总结一些在数据分析挖掘中可能用到的功能,方便大家索引或者从一种语言迁移到另一种。概率图模型文本基本操作类别英中中文分词未知主题模型类别未知未知未知值得留意的是的新第三方模块,与其他分析可视化挖掘报表工具的交互类别实际是的服务包 写在前面 在此总结一些在数据分析/挖掘中可能用到的功能,方便大家索引或者从一种语言迁移到另一种。当然,这篇博客还会随时更新(不会另起一篇,为了方便大...

    array_huang 评论0 收藏0
  • Python之使用Pandas库实现MySQL数据库的读写

    摘要:本次分享将介绍如何在中使用库实现数据库的读写。提供了工具包及对象关系映射工具,使用许可证发行。模块实现了与不同数据库的连接,而模块则使得能够操作数据库。   本次分享将介绍如何在Python中使用Pandas库实现MySQL数据库的读写。首先我们需要了解点ORM方面的知识。 ORM技术   对象关系映射技术,即ORM(Object-Relational Mapping)技术,指的是把关...

    darcrand 评论0 收藏0
  • 这里有8个流行的Python可视化工具包,你喜欢哪个?

    摘要:下面,作者介绍了八种在中实现的可视化工具包,其中有些包还能用在其它语言中。当提到这些可视化工具时,我想到三个词探索数据分析。还可以选择样式,它模拟了像和等很流行的美化工具。有很多数据可视化的包,但没法说哪个是最好的。 showImg(https://segmentfault.com/img/remote/1460000019029121); 作者:Aaron Frederick 喜欢用...

    testbird 评论0 收藏0

发表评论

0条评论

ernest.wang

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<