资讯专栏INFORMATION COLUMN

数据科学 第 3 章 12 处理时间序列,小时、分

Atom / 1952人阅读

摘要:时间序列,日期格式处理原以为本章是讲怎么用处理时间格式,比如提取年月之类的。新增一列日期,不要时分新增两列年,月,以便后续分析。这个方法太复杂,而且处理时间可能会更长,看下面的简单方法新增月份年。

时间序列,日期格式处理

原以为本章是讲怎么用python处理时间格式,比如提取年月之类的。
但本节写的是时间格式已经工整后的事,暂时不是我想学的,所以跳过,就没有写公式了。

下面的函数时之前谷歌之后学到的,先放上来,书里面的在分割线后面:

--1、把列表中 str 转为datetime格式:pd.to_datetime

这次使用的是trd的数据,对用户名,产品,姓名做了处理。
要改变df中times的格式
cycle 3576 non-null object
amount 3576 non-null float64
times 3576 non-null object

#修改时间格式
# datetime.strptime(df.times, %Y%m%d)  这行代码是先测试是否修改成功
df["times"] = pd.to_datetime(df["times"], format="%Y/%m/%d")

更改后
cycle 3576 non-null object
amount 3576 non-null float64
times 3576 non-null datetime64[ns]

*讲了asfreq() 和 resample() 的使用方法,但是没有get到意思,略过。

--2、只取日期,不要时分

新增一列date,保留年月日,不要小时和分。

#新增一列日期,不要时分
df["date"] = pd.to_datetime(df["times"]).dt.normalize()
df

新增两列:年,月,以便后续分析。
(-- 这个方法太复杂,而且处理时间可能会更长,看下面的简单方法!!!)

#新增月份、年。在月份补齐为两位数,要先把原来的month改为字符串,再补齐原month,最后循环
df["year"] = [i.year for i in df["date"]]
df["month"] = [str(i.month).zfill(2) for i in df["date"]]
df

数据处理完成之后,就可以用年月创建透视表了。

画了一个17年每天交易量的图,顺便引出下一章的内容,画图。

df.groupby(["date"])["amount"].count().plot()

把图删了,下一章全是讲的图,而且要突出下面的内容。

3、读取日期中的年、月、日、小时、分、等等等等

啊啊啊啊啊啊啊!!!!!这个真的找了好久的方法怎么读取dataframe中的小时和分,搜索之后全是读取现在的,妹的,你要现在的有鬼用啊,你的数据里面不是已经有具体的时间了吗,分析现在的时分干嘛?找了2个小时,翻来覆去都是这些没用的,越找越暴躁,最后还是在stackoverflow上找到了,感恩

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/44990.html

相关文章

  • ApacheCN 人工智能知识树 v1.0

    摘要:贡献者飞龙版本最近总是有人问我,把这些资料看完一遍要用多长时间,如果你一本书一本书看的话,的确要用很长时间。为了方便大家,我就把每本书的章节拆开,再按照知识点合并,手动整理了这个知识树。 Special Sponsors showImg(https://segmentfault.com/img/remote/1460000018907426?w=1760&h=200); 贡献者:飞龙版...

    刘厚水 评论0 收藏0
  • 数据科学 5 建模过程 与 决策树模型

    摘要:一周没写文了,之前干什么去了呢本周前半部分卡在画图了,然后的时间在处理数据,处理数据是我目前在画图和机器学习上一个重大的障碍,处理各种报错各种不适合,等我学会了和你再来堵我呀 一周没写文了,之前干什么去了呢?本周前半部分卡在画图了,然后1/3的时间在处理数据,处理数据是我目前在画图和机器学习上一个重大的障碍,python处理各种报错各种不适合,等我学会了kettle和spark你再来堵...

    lowett 评论0 收藏0
  • 数据科学 4 1-3 画图的简单设置

    摘要:保存打开执行打开的时候要先加载一个包第二节画个图的方法风格面向对象画图第节简易线型图先设置。是一个可以装图形文字的容器是带有刻度和标签的矩形。 第 4 章是讲用matplotlib画图 期待已久的内容,用可视化展示数据比丢一张数据表给他好的多,在建模的时候先画个图会清晰不少,下面进入正题: 数据源:当然是上一章最后一节的提取了小时的sougou数据 第一节:保存就是教你怎么保存画的图,...

    ShevaKuilin 评论0 收藏0
  • Javascript中的时间

    摘要:比如中国,从西到东横跨东五东六东七东八和东九五个时区,中华人民共和国成立以后,全国统一采用首都北京所在的东八时区的区时作为标准时间,称为北京时间。全球所有国家根据时间和各自国家所在的时区确定当地时间,以此来保证全球时间的低误差同步。 我们在编程时,不可避免地会和时间打交道。 比如要完成一次秒杀活动, 就会涉及到时间存取,时间同步和时间差值计算等诸多细节。一个JavsScript的简单例...

    MageekChiu 评论0 收藏0
  • 如何在高性能计算中稳中求胜?

    摘要:年月日,由中国信息通信研究院以下简称中国信通院中国通信学会中国通信标准化协会共同主办的可信云大会在北京国际会议中心召开。两日内,共有人次参与了本届会议。2018年8月14-15日,由中国信息通信研究院(以下简称中国信通院)、中国通信学会、中国通信标准化协会共同主办的2018可信云大会在北京国际会议中心召开。两日内,共有5000人次参与了本届会议。会上公布了第十批通过可信云评估的服务名单,揭晓...

    yeooo 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<