资讯专栏INFORMATION COLUMN

Pandas完成在线文件和剪切板数据读取详细说明

89542767 / 502人阅读

  文中关键给大家介绍是指Pandas二种少使用的读取文件方式:载入在线文件的信息和载入剪切板的信息,感兴趣的朋友能够来了解一下吧一块儿学习下


  序言


  小伙伴们好,我就是Peter~


  文中记载的是Pandas二种少使用的读取文件方式:

  载入在线文件的信息
  载入剪切板的信息
  申明:文中案例和在线数据仅限于学术研究共享
  read_html
  该函数公式表示是立即载入线上的html文件,一般都是图表形式;将HTML的表格转换为DataFrame的1种迅速方便快捷的方式。
  用这种方法针对迅速合拼来自各式各样网页页面里的报表非常有利,就免去了抓取数据信息再去载入的时间也。
  实际函数的参数为:
  pandas.read_html(io,#文件io对象;路径或者io.Strings对象
  match='.+',#str或编译的正则表达式,可选
  flavor=None,#要使用的解析引擎,None是默认值
  header=None,#文件表头
  index_col=None,#索引
  skiprows=None,#跳过行
  attrs=None,#属性
  parse_dates=False,#日期解析
  thousands=',',#千分位
  encoding=None,#编码
  decimal='.',#识别为小数点的字符
  converters=None,#属性转换
  na_values=None,#空值信息
  keep_default_na=True,#是否保持空值
  displayed_only=True#是否应该解析带有“display:none”的元素
  )
  在线文件1
  读取维基百科上一份历届奥运会乒乓球冠军的相关数据。该地址下的部分表格形式的数据:
  In[3]:
  url="https://zh.m.wikipedia.org/zh/%E5%A5%A5%E6%9E%97%E5%8C%B9%E5%85%8B%E8%BF%90%E5%8A%A8%E4%BC%9A%E4%B  
  df=pd.read_html(url)
  df 9%92%E4%B9%93%E7%90%83%E5%A5%96%E7%89%8C%E5%BE%97%E4%B8%BB%E5%88%97%E8%A1%A8"
  df=pd.read_html(url)
  df
  Out[3]:
  我们观察到此时读取到的df是一个列表,总长度是15
 list
  In[4]:
   len(df)
  Out[4]:
  9
  查看列表中的部分元素:此时就是一个个的DataFrame形式的数据
  在线文件2
  一个国外网站下的数据
  In[7]:
  df1=pd.read_html("https://www.fdic.gov/resources/resolutions/bank-failures/failed-bank-list")
  type(df1)
  Out[7]:
  list
  In[8]:
  len(df1)
  In[9]:
  df1[0]
  Out[9]:
  读取在线CSV文件
  以读取GitHub上一个CSV文件为例:
  方式1:直接读取

  url="https://raw.githubusercontent.com/cs109/2014_data/master/countries.csv"


  pd.read_csv(url)


  方式2:通过io.Strings对象


  url="https://raw.githubusercontent.com/cs109/2014_data/master/countries.csv"
  response=requests.get(url).content#先发请求
  df2=pd.read_csv(io.StringIO(response.decode('utf-8')))
  df2#效果同上
  Pandas读取剪贴板
  pandas.read_clipboard(sep='s+',**kwargs)


  官网地址


  一个简单的例子说明函数使用:假设本地目录下有这样Excel表格的数据


  1、先剪贴数据:【Ctrl+C】


  2、运行代码下面的代码,按下MacOS中的【向上的箭头】+【回车键】,完成读取


  Windows下面应该是【Shift+Enter】


  如果数据比较少,省去了通过Excel或者CSV文件的读取方式的时间:


  综上所述,这篇文章就给大家介绍到这里了,希望可以给大家带来帮助。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/128736.html

相关文章

  • 如何利用python在剪贴读取/写入数据

      小编写这篇文章的主要目的,主要给大家讲解一些关于python的一些小技巧,比如说使用python去进行读取和写入数据,那么,这些数据怎么在剪贴板上去进行相关的处理呢,下面就跟着小编的步伐,去了解一下具体内容吧。  读取剪贴板上的数据  先给大家介绍pandas.read_clipboard,从剪贴板读取文本并传递到Read_csv。  pandas.read_clipboard(sep=...

    89542767 评论0 收藏0
  • js拖拽粘贴上传与CodeMirror

    摘要:属性介绍默认是默认是在粘贴操作时为空剪切板中的各项数据剪切板中的数据类型。避免重复创建上传中文件成功失败处理已上传上传出错添加文件到队列并上传开始上传其他参考获取剪切板内容,控制图片粘贴在线代码编辑器事件说明 Markdown编辑器选用https://simplemde.com它是一款纯js实现的markdown编辑器。缺点不支持图片上传。那我们就得改造它。simplemde是基于co...

    FullStackDeveloper 评论0 收藏0
  • 剪切粘贴上传图片功能的javascript实现

    摘要:平时的开发中我们难免要上传一些网页截图图片等,传统的选择文件上传使用起来不方便,这里介绍一种使用和实现的剪切板黏贴上传图片功能。剪切板中图片的获取与上传通过,我们可以以的形式获取到剪切板中的图片,然后将数据作为参数通过的方式传输到服务器端。 平时的开发中我们难免要上传一些网页截图、图片等,传统的选择文件上传使用起来不方便,这里介绍一种使用js和node实现的剪切板黏贴上传图片功能。当我...

    anyway 评论0 收藏0
  • HeyUI组件库按需加载功能上线,盘点HeyUI组件库有哪些独特功能?

    摘要:测试复制至剪切板的文本测试相关文档复制剪切板滚动至视图内其实,这是一个非常方便的功能,比如说,分页加载后滚动至头部,切换页面时切换至头部。HeyUI组件库 如果你还不了解heyui组件库,欢迎来我们的官网或者github参观。 官网 github 当然,如果能给我们一颗✨✨✨,那是最赞的了! 按需加载 当heyui组件库的组件越来越多的时候,按需加载的功能终于上线了。 话不多说,先把按需...

    IamDLY 评论0 收藏0
  • js获取剪切内容,js控制图片粘贴。

    摘要:在用户执行粘贴操作的时候,能够获得剪切板的内容,本文讨论一下这个问题。目前只有支持获取剪切板中的图片数据。这么多的判断条件,基本可以确定通过剪切板过来的是粘贴的文件。 在用户执行粘贴操作的时候,js能够获得剪切板的内容,本文讨论一下这个问题。 目前只有Chrome支持获取剪切板中的图片数据。还好需要这个功能的产品目前只支持Chrome和Safari,一些Chrome的新特性是可以尽情使...

    KaltZK 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<