资讯专栏INFORMATION COLUMN

Pandas Series

Y3G / 2290人阅读

摘要:内插或填充或前向或进位填充或后向或进位填充转换为字典可以通过转换为一个字典判断判断,判断有两个方法和会对的每个元素的值进行判断,如果是则为,否则为。会对的每个元素的值进行判断,如果是则为,否则为删除填充项

创建

通过列表创建

si = pd.Series([1, 2, 3, 4])

通过 np.arange() 创建

si = pd.Series(np.arange(8))

通过对象创建

si = pd.Series({"a": 1, "b": 2, "c": 3})
属性

查看Series的values

si.values  # array([1, 2, 3])

查看Series的index

si.index  # Index(["1", "2", "3"], dtype="object")
方法 获取元素
si = pd.Series([1, 2, 3], index=["A", "B", "C"])
si["A"]  # 1
si[0]  # 1
对值过滤
si = pd.Series([1, 2, 3], index=["A", "B", "C"])
si[si > 1]
# B 2
# C 3
重置编号

Series默认编号为int类型的数字,我们可以重置Series的编号

在创建时重置

si = pd.Series([1, 2, 3], index=["A", "B", "C"])
# A    1
# B    2
# C    3

通过 reindex() 方法重置

reindex() 方法接收一个新的 index 列表,用于替换原来的 index ,如果新的 index 包含原来的 index 没有的元素则新增的index元素默认填充为 NaN ,可以通过指定参数 fill_value 改变默认的值。

si = pd.Series([1, 2, 3])
si.reindex(index=["A", "B", "C", "D", "E"])
# A    NaN
# B    NaN
# C    NaN
# D    NaN
# E    NaN
# dtype: float64
s1 = pd.Series([1, 2, 3])
s1.reindex(index=["A", 2, "C", "D", "E"], fill_value=0)
# A    0
# B    3
# C    0
# D    0
# E    0
# dtype: int64

内插或填充 method

obj1=pd.Series(range(3), index=["a", "c", "e"])
print(obj1.reindex(["a", "b", "c", "d", "e"], method="pad"))
# a    0
# b    0
# c    1
# d    1
# e    2
# dtype: int64

ffillpad: 前向(或进位)填充
bfillbackfill : 后向(或进位)填充

转换为字典

Series可以通过 to_dict() 转换为一个Python字典:

si = pd.Series([1, 2, 3], index=["A", "B", "C"])
si.to_dict()
NaN 判断NaN

判断NaN,Series判断NaN有两个方法 isna()notna()

isna() 会对Series的每个元素的值进行判断,如果是NaN则为 True,否则为False

notna()会对Series的每个元素的值进行判断,如果是NaN则为 False,否则为True

si = pd.Series([1, 2, 3, np.nan], index=["A", "B", "C", "D"])
si.isna()
# A    False
# B    False
# C    False
# D     True
# dtype: bool
删除NaN
si.dropna()
填充NaN项
si.fillna(value)

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/42768.html

相关文章

  • python_pandas学习

    摘要:的名称来自于面板数据和数据分析。以下的内容主要以为主。终端输入导入相关模块是一种类似于一维数组的对象,它由一组数据各种数据类型以及一组与之相关的数据标签即索引组成。如果仅传入一个序列,则会重新索引行函数的参数参数说明用作索引的新序列。 原文链接 numPy pandas的数据结构介绍 简介 Pandas [1] 是python的一个数据分析包,最初由AQR Capital Mana...

    codercao 评论0 收藏0
  • 【数据科学系统学习】Python # 数据分析基本操作[二] pandas

    摘要:中面向行和面向列的操作基本是平衡的。用层次化索引,将其表示为更高维度的数据。使用浮点值表示浮点和非浮点数组中的缺失数据。索引的的格式化输出形式选取数据子集在内层中进行选取层次化索引在数据重塑和基于分组的操作中很重要。 我们在上一篇介绍了 NumPy,本篇介绍 pandas。 pandas入门 Pandas 是基于Numpy构建的,让以NumPy为中心的应用变的更加简单。 pandas...

    jayzou 评论0 收藏0
  • Python数据分析工具pandas

    摘要:一关于是基于构建,经许可的开源库,为开发者提供高性能,易用的数据结构和数据分析工具。官网二数据结构一维标记的数组,能够保存任何数据类型整数,字符串,浮点数,对象等。轴标签统称为索引。二维的表格型数据结构。 一、关于pandas pandas是基于NumPy构建,经BSD许可的开源库,为Python开发者提供高性能,易用的数据结构和数据分析工具。pandas官网 二、数据结构 1、Ser...

    ernest.wang 评论0 收藏0
  • Pandas技巧大全:含具体代码实现

    摘要:查看数据的基本统计信息。用处是用于数据读写处理更改提取等一系列操作的包,可以说,所有能实现的功能,都可以通过代码轻松实现,因此,对于学习非常重要。如果在里,需要翻到最低和最右,而且可能由于溢出无法穷尽可以简单的实现。 放在前面的话                         这学期刻意少...

    netmou 评论0 收藏0
  • Python数据分析学习笔记之Pandas入门

    摘要:是一个数据分析的开源库。与表格或关系数据库中的表非常神似。注意带有一个索引,类似于关系数据库中的主键。的统计函数分组与聚合通过方法,可以对数据组施加一系列的函数。函数的作用是串联,追加数据行使用函数。 pandas(Python data analysis)是一个Python数据分析的开源库。pandas两种数据结构:DataFrame和Series 安装:pandas依赖于NumPy...

    zqhxuyuan 评论0 收藏0

发表评论

0条评论

Y3G

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<