摘要:表示从负无穷积分到时的返回值,可以得到个随机的符合正态分布的数字。
1.这些操作都要确保已经在电脑中安装好了Anaconda集成库,如果安装好后运行出错误,可以将原来电脑中的python卸载重新安装Anaconda,建议安装时直接将添加环境变量打勾,否则以后得自己添加环境变量,在Pycharm中的编译器选择Anaconda安装文件夹中的python。在Pycharm中新建一个data文件夹用来存放数据文件。
2.打开Python Console。
3.首先在用python读取数据,需要先输入import pandas as pd引入pandas包,再输入df=pd.read_csv("./data/CityData.csv")读取数据,最后输入df显示数据。
4.分别输入type(df)和type(df["cid"])可以发现两种数据类型不同。
5.计算平均值:df.mean()或df["xid"].mean()
6.计算中位数:输入df.median()或df["yid"].median
7.求四分位数:输入df.quantile(q=0.25)
8.求众数:输入df.mode()或df["xid"].mode()
9.求标准差:输入df.std()或df["yid"].std()
10.计算方差:df.var()或df["xid"].var()
11.求和:df.sum()或df["xid"].sum()
12.计算偏态系数:df.skew()或df["yid"].skew()
13.计算峰态系数:df.kurt()或df["yid"].kurt()
14.生成正态分布函数,pandas无法直接生成,需要先引入scipyimport scipy.stats as ss,再输入ss.norm,这时生成的是一个正态分布的对象,我们输入ss.norm.stats(moments="mvsk")查看一下,mvsk分别代表的是均值、方差、偏态系数、峰态系数。
这时我们可以看到生成四个值,分别对应正态分布的mvsk分别为0、1、0、0。
15.ss.norm.pdf(0.0)表示横坐标为0时的纵坐标的值。ss.norm.ppf(0.9)表示从负无穷累积到返回值时得到的值为0.9,其中ppf后的值必须在0-1之间。ss.norm.cdf(2)表示从负无穷积分到2时的返回值,ss.norm.rvs(size=10)可以得到10个随机的符合正态分布的数字。
16.类似的,我们可以分别输入ss.chi2和ss.t得到卡方分布和T分布。
17.此外我们还可以进行抽样,输入df.sample(n=10)从数据中抽取10个样本,输入df.sample(frac=0.1)从数据中抽取10%的样本。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/43006.html
如何精确地记录一篇文章的阅读量是一个比较复杂的问题,不过对于我们的博客来说,没有必要记录的那么精确。因此我们使用一种简单但有效的方式来记录博客文章的阅读量:文章每被浏览一次,则其阅读量 +1,即所谓的文章页面 PV(Page View)数。虽然简单粗暴,但却高效实用。 增加新字段 为了记录文章的浏览量,需要在文章的数据库表中新增一个用于存储阅读量的字段。因此给博客文章的模型新增一个 views 字...
阅读 3163·2021-11-15 11:37
阅读 2410·2021-09-29 09:48
阅读 3743·2021-09-22 15:55
阅读 2971·2021-09-22 10:02
阅读 2599·2021-08-25 09:40
阅读 3188·2021-08-03 14:03
阅读 1656·2019-08-29 13:11
阅读 1539·2019-08-29 12:49