资讯专栏INFORMATION COLUMN

Python wordcloud库学习小结

Jokcy / 1268人阅读

摘要:库常规方法方法描述例子向对象中加载文本将词云输出为图像文件,或格式应用实例配置对象参数加载词云文本输出词云文件分隔以空格分隔单词统计单词出现次数并过滤字体根据统计配置字号布局颜色环境尺寸配置对象参数参数参数描述例子指定词云对象生成图片的宽度

wordcloud库常规方法

w = wordcloud.WordCloud()

方法 描述 例子
w.generate(txt) 向wordcloud对象w中加载文本txt >>>w.generate("Python and WordCloud")
w.to_file(filename) 将词云输出为图像文件,.png或.jpg格式 >>>w.to_file("outfile.png")
应用实例:
import wordcloud
w = wordcloud.WordCloud() #配置对象参数
w.generate("wordcloud by Python") #加载词云文本
w.to_file("pywordcloud.png") #输出词云文件

分隔: 以空格分隔单词

统计: 单词出现次数并过滤

字体: 根据统计配置字号

布局: 颜色环境尺寸

配置对象参数

w = wordcloud.WordCloud(<参数>)

参数 描述 例子
width 指定词云对象生成图片的宽度,默认400像素 >>>w=wordcloud.WordCloud(width=600)
height 指定词云对象生成图片的高度,默认200像素 >>>w=wordcloud.WordCloud(height=400)
min_font_size 指定词云中字体的最小字号,默认4号 >>>w=wordcloud.WordCloud(min_font_size=10)
max_font_size 指定词云中字体的最大字号,根据高度自动调节 >>>w=wordcloud.WordCloud(max_font_size=20)
font_step 指定词云中字体字号的步进间隔,默认为1 >>>w=wordcloud.WordCloud(font_step=2)
font_path 指定文件字体的路径,默认None >>>w=wordcloud.WordCloud(font_path="msyh.ttc")
max_words 指定词云显示的最大单词数量,默认200 >>>w=wordcloud.WordCloud(font_step=2)
stop_words 指定词云的排除词列表,即不显示的单词列表 >>>w=wordcloud.WordCloud(stop_words={"Python"})
mask 指定词云形状,默认为长方形,需要应用imread()函数 >>>from scipy.misc import imread
>>>mk=imread("pic.png")
>>>w=wordcloud.WordCloud(mask=mk)
background_color 指定词云图片的背景颜色,默认为黑色 >>>w=wordcloud.WordCloud(background_color="white")
应用实例:

英文(以空格分隔单词)

import wordcloud
txt = "life is short, you need python"
w = wordcloud.WordCloud(background_color = "white")
w.generate(txt)
w.to_file("pywcloud.png")

中文(中文需要先分词并组成空格分隔字符串)

import jieba
import wordcloud
txt = "程序设计语言是计算机能够理解和识别用户操作意图的一种交互体系,它按照特定规则组织计算机指令,使计算机能够自动进行各种运算处理。 "
w = wordcloud.WordCloud( width=1000,
font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("pywcloud.png")

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/41724.html

相关文章

  • python玩微信(聊天机器人,好友信息统计)

    摘要:用实现微信好友性别及位置信息统计这里使用的库开发。使用图灵机器人自动与指定好友聊天让室友帮忙测试发现发送表情发送文字还能回应,但是发送图片可能不会回复,猜应该是我们申请的图灵机器人是最初级的没有加图片识别功能。 1.用 Python 实现微信好友性别及位置信息统计 这里使用的python3+wxpy库+Anaconda(Spyder)开发。如果你想对wxpy有更深的了解请查看:wxpy...

    Youngs 评论0 收藏0
  • python数据分析微博热门

    摘要:前者对中文进行分词后者图形化展示词语的出现频率。众所周知,中文系的语言处理恐怕是最难的自然语言处理的语种。研究中文自然语言处理将是一个长久而大的工程,对于分析数据我们不是要研究自然语言处理 接上篇,这一篇将从技术层面讲讲是如何实现的。阅读本文您将会了解如何用python爬取微博的评论以及如何用python word_cloud库进行数据可视化。 上一篇:程序员代码下的许豪杰 准备工作 ...

    firim 评论0 收藏0
  • Python如何生成词云(详解)

    摘要:前言今天教大家用模块来生成词云,我读取了一篇小说并生成了词云,先看一下效果图效果图一效果图二根据效果图分析的还是比较准确的,小说中的主人公就是程理,所以出现次数最多。 前言 今天教大家用wrodcloud模块来生成词云,我读取了一篇小说并生成了词云,先看一下效果图: 效果图一: showImg(https://segmentfault.com/img/remote/1460000015...

    Juven 评论0 收藏0
  • Python生成歌词词云

    摘要:上面是生成词云的方法封装,还有一些其他方法根据词频生成词云根据文本生成词云根据词频生成词云根据文本生成词云将长文本分词并去除屏蔽词此处指英语,中文分词还是需要自己用别的库先行实现,使用上面的对现有输出重新着色。 对于数据展示这一块有时候会用到词云,python中提供的wordcloud模块可以很灵活的完成生成词云除了使用python提供的wordcloud模块以为还有在线的生成方式ht...

    junbaor 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<