小编写这篇文章的一个主要目的,主要是给大家去做一个解答,继续给大家解答关于Python pandas的相关内容,比如使用Python pandas去替换指定的一些数据,那么,具体的方法是什么呢?下面就给大家解答下。
一、构造dataframe
import pandas as pd import numpy as np df=pd.DataFrame(np.arange(16).reshape(4,4),columns=["sh","bj","sz","gz"],index=["one","two","three","four"]) df.iloc[0,1]=np.nan
二、替换指定数据(fillna、isin、replace)
1、用"sz"列的同行数据将"bj"列的空值替换掉
df["bj"].fillna(df["sz"],inplace=True)
2、在1的基础上,将"sz"列为2或者6的数据替换成-4
法一:直接替换
df.loc[df["sz"].isin([2,6]),"sz"]=-4
法二:函数replace()替换
df.replace({"sz":{2:-4,6:-4}},inplace=True)
三、替换函数replace()详解
原dataframe如下:
1、全局替换元素
1)替换单个元素
df.replace(-4,0)#将所有的-4元素替换为0,返回dataframe
2)替换多个元素
法一:在字典中指定
df.replace({-4:0,4:1})#将-4替换为0,4替换为1
法二:在列表中指定
df.replace([-4,4],[0,1])#将-4替换为0,4替换为1
其中法二在列表中指定的方式,如果多个元素替换为相同的值,会更方便。
df.replace([-4,4],1)#将-4和4替换为1
2、通过指定条件替换元素
df.replace({"bj":{5:10,9:50},"gz":{7:10}})#将"bj"列的5替换为10,9替换为50,将gz列的7替换为10
也可通过直接索引列的方式来替换指定列的元素
df["bj"].replace({5:10,9:50})#将"bj"列的5替换为10,9替换为50
3、通过模糊条件替换指定元素
法一:通过字符串方法替换str.replace()
df["bj"]=df["bj"].str.replace("北","南").fillna(df["bj"])#将"bj"列中的"北"字替换成"南"字,若无"北"值,则不替换
法二:通过正则匹配替换
df.replace("(.*)北(.*)","南京",regex=True)#将"bj"列中的含有"北"字的元素替换成"南京"
最后,如果需要在原始数据上完成替换,可以通过设置参数inplace=True。
综上所述,这篇文章就给大家介绍到这里了,希望可以给大家带来帮助。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/128356.html
摘要:数据规整化清理转换合并重塑数据聚合与分组运算数据规整化清理转换合并重塑合并数据集可根据一个或多个键将不同中的行链接起来。函数根据样本分位数对数据进行面元划分。字典或,给出待分组轴上的值与分组名之间的对应关系。 本篇内容为整理《利用Python进行数据分析》,博主使用代码为 Python3,部分内容和书本有出入。 在前几篇中我们介绍了 NumPy、pandas、matplotlib 三个...
摘要:中面向行和面向列的操作基本是平衡的。用层次化索引,将其表示为更高维度的数据。使用浮点值表示浮点和非浮点数组中的缺失数据。索引的的格式化输出形式选取数据子集在内层中进行选取层次化索引在数据重塑和基于分组的操作中很重要。 我们在上一篇介绍了 NumPy,本篇介绍 pandas。 pandas入门 Pandas 是基于Numpy构建的,让以NumPy为中心的应用变的更加简单。 pandas...
摘要:的名称来自于面板数据和数据分析。以下的内容主要以为主。终端输入导入相关模块是一种类似于一维数组的对象,它由一组数据各种数据类型以及一组与之相关的数据标签即索引组成。如果仅传入一个序列,则会重新索引行函数的参数参数说明用作索引的新序列。 原文链接 numPy pandas的数据结构介绍 简介 Pandas [1] 是python的一个数据分析包,最初由AQR Capital Mana...
Pandas是一个python数据分析库,它提供了许多函数和方法来加快数据分析过程,下面这篇文章主要给大家介绍了关于python基础篇之pandas常用基本函数的相关资料,需要的朋友可以参考下 前言 这篇主要整理pandas常用的基本函数,主要分为五部分: 汇总函数 特征统计函数 唯一值函数 替换函数 排序函数 1、汇总函数 常用的主要是4个: tail():返回表或序列的后...
阅读 873·2023-01-14 11:38
阅读 819·2023-01-14 11:04
阅读 668·2023-01-14 10:48
阅读 1823·2023-01-14 10:34
阅读 873·2023-01-14 10:24
阅读 737·2023-01-14 10:18
阅读 466·2023-01-14 10:09
阅读 500·2023-01-14 10:02