使用pandas进行数据分析的时候,我们经常需要对DataFrame的行或者列进行索引。使用pandas进行索引的方法主要有三种:直接使用行或者列标签、loc函数和iloc函数。
举个简单的例子:
import numpy as npimport pandas as pddf = pd.DataFrame({"Fruits":["apple","pear","banana","watermelon"],"Price":[1.2,1.4,2.3,4.2],"Sales":[11,45,25,16]})df
生成的DataFrame如下所示:
Fruits | Price | Sales | |
0 | apple | 1.2 | 11 |
1 | pear | 1.4 | 45 |
2 | banana | 2.3 | 25 |
3 | watermelon | 4.2 | 16 |
假如我们要选取df的Fruits和Price两列,则
df[["Fruits","Price"]]
Fruits | Price | |
0 | apple | 1.2 |
1 | pear | 1.4 |
2 | banana | 2.3 |
3 | watermelon | 4.2 |
假如我们要选取df的第2、3行,则
df[2:4]
Fruits | Price | Sales | |
2 | banana | 2.3 | 25 |
3 | watermelon | 4.2 | 16 |
loc函数是基于行标签和列标签进行索引的,其基本用法为:
DataFrame.loc[行标签,列标签]
假如我们要选取df的第2、3行和Price、Sales对应的列,则
df[2:3,"Price":"Sales"]
Price | Sales | |
2 | 2.3 | 25 |
3 | 4.2 | 16 |
假如我们要选取所有的行和Fruits、Sales对应的列,则
df.loc[:,["Fruits","Sales"]]
Fruits | Sales | |
0 | apple | 11 |
1 | pear | 45 |
2 | banana | 25 |
3 | watermelon | 16 |
iloc函数是基于行和列的位置进行索引的,索引值从0开始,并且得到的结果不包括最后一个位置的值,其基本用法为:
DataFrame.iloc[行位置,列位置]
假如我们要选取df的第2、3行和第1、2列,则
df.iloc[2:4,1:3]
Price | Sales | |
2 | 2.3 | 25 |
3 | 4.2 | 16 |
假如我们要选取所有的行和第0、2列,则
df.iloc[:,[0,2]]
Fruits | Sales | |
0 | apple | 11 |
1 | pear | 45 |
2 | banana | 25 |
3 | watermelon | 16 |
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/121288.html
摘要:上海本科年广州硕士年广州本科应届毕业生北京本科年北京本科年上海本科年广州硕士年广州本科应届毕业生当然,如果想看尾部的数据,可以用函数,它默认显示尾部的行,与相反。 数据结构之DataFrame pandas中有两种数据结构Series和DataFrame,Series类似于Numpy中的一维数组,这里就不详细记录了。主要记录下DataFrame的常见使用。 DataFrame是一个表格...
Python Pandas的主要左右是解决大量的数据,快速的对数据去进行批量的处理,大大提高工作的效率。那么,里面的loc和iloc函数,具体是怎么进行使用呢?怎么知道每个函数的基本用法呢?下面小编就给大家详细的解答下。 1 loc和iloc的含义 loc表示location的意思;iloc中的loc意思相同,前面的i表示integer,所以它只接受整数作为参数。 2用法 import...
为什么你需要pandas 大家好,今天想和大家分享一下有关pandas的学习新的,我因工作需要,从去年12月开始接触这个非常好用的包,到现在为止也是算是熟悉了一些,因此发现了它的强大之处,特意想要和朋友们分享,特别是如果你每天和excel打交道,总是需要编写一些vba函数或者对行列进行groupby啊,merge,join啊之类的,相信我,pandas会让你解脱的。 好啦,闲话少说,这篇文章的基础...
摘要:导入数据集使用自带的方法,将数据集存入变量中。 1、导入数据集 使用Pandas自带的方法,将数据集存入变量df中。 import pandas as pd df = pd.read_excel(‘./team.xlsx’) print(df)2、查看数据 df.head() #查看数据的前5行,可指定行数 df.tail...
环境:python 3.6.8 以某米赛尔号举个例子吧: showImg(https://segmentfault.com/img/bVboqzz?w=396&h=215);showImg(https://segmentfault.com/img/bVboqzA?w=362&h=216); >>> pd.read_excel(1.xlsx, sheet_name=Sheet2) 名字 ...
阅读 3184·2021-10-13 09:39
阅读 1993·2021-09-27 13:36
阅读 3054·2021-09-22 16:02
阅读 2560·2021-09-10 10:51
阅读 1551·2019-08-29 17:15
阅读 1512·2019-08-29 16:14
阅读 3458·2019-08-26 11:55
阅读 2524·2019-08-26 11:50