资讯专栏INFORMATION COLUMN

⚡一文告诉你蓬莱阁到底如何⚡

KaltZK / 3202人阅读


完成目标:
  获取评论并制作词云


一、前言

  毕竟会在烟台待上三年,先了解了解烟台这个地方。

二、环境准备

编辑器:pycharm

用到的库:requests、wordcloud、jieba

三、具体实现

1、短评游客评论并保存

  爬取去哪儿网关于蓬莱岛的游客评论的前20页

def save_comment():    fp = open("comment.txt", mode="w", encoding="utf-8")    for num in range(1, 20):        url = "https://piao.qunar.com/ticket/detailLight/sightCommentList.json?sightId=3827&index=" + str(            num) + "&page=" + str(num) + "&pageSize=10&tagType=0"        headers = {            "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36 Edg/93.0.961.38",            "accept": "application/json, text/javascript, */*; q=0.01",        }        response = requests.get(url=url, headers=headers)        try:            commentList = response.json()["data"]["commentList"]            for comment in commentList:                # content.append()                fp.write(comment["content"] + "/n")        except Exception as e:            pass    fp.close()

2、词云制作

  读取评论并制作词云

def stopwordslist(): # 停用词列表    stopwords = [line.strip() for line in open("Chinesestopword.txt", encoding="UTF-8").readlines()]    return stopwordsdef get_wcd():    fp = open("comment.txt", "r", encoding="utf-8")    data = fp.read()    stopwords=stopwordslist()    data_list = jieba.lcut(data)    data_list = " ".join(data_list)    outstr = ""        for word in data_list:        if word not in stopwords:            if word != "/t":                outstr += word                outstr += " "                    wcd = wordcloud.WordCloud(        font_path="simkai.ttf"        , colormap="brg"        , width=800        , height=400        , max_words=200        , background_color="white"        , scale=16    ).generate(outstr)        wcd.to_file("comment.jpg")

3、成果

四、最后

  还是不错滴,有机会去~~~

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/119543.html

相关文章

  • J.U.C|一文搞懂AQS

    摘要:接着线程过来通过方式获取锁,获取锁的过程就是通过操作变量将其值从变为。线程加锁成功后还有一步重要的操作,就是将设置成为自己。线程屁颠屁颠的就去等待区小憩一会去了。 一、写在前面 这篇文章,我们聊一聊Java并发中的核武器, AQS底层实现。 不管是工作三四年、还是五六年的在工作或者面试中涉及到并发的是时候总是绕不过AQS这个词。 首先,确实还有很多人连AQS是什么都不知道,甚至有的竟...

    tommego 评论0 收藏0
  • python能做什么软件?Python到底能干嘛,一文看懂

    摘要:语料库是由文本构成的数据集通过提供现成的文本数据来辅助文本处理。那么可以用来做什么呢我自己是一名从事是不错的入门选项。大数据和人工智能是机器学习和的主要开发语言。 Python培训有哪些内容?很多零基础学员不知道Python软件是干什么用的?Python软件是Python工程师编写代码时所需...

    YorkChen 评论0 收藏0
  • 推荐:7 月份值得一看的 Java 技术干货!

    摘要:月底了,又到了我们总结这一个月技术干货的时候了,又到了我们给粉丝免费送书的日子了。 月底了,又到了我们总结这一个月 Java 技术干货的时候了,又到了我们给粉丝免费送书的日子了。 7 月份干货总结 Oracle 发布了一个全栈虚拟机 GraalVM 一文带你深入拆解 Java 虚拟机 图文带你了解 8 大排序算法 Spring Boot 2.x 新特性总结及迁移指南 Spring B...

    saucxs 评论0 收藏0
  • 玩概念还是真好用?一文读懂融合CDN

    摘要:但是,客户在选择的时候,不要只看概念,一定要紧盯智能,看目标平台是否在网络监控大数据分析调度管理等方面下大力气天浩提醒一个小小的秘诀,就是看其有没有服务等巨头,被多家巨头选用,一般不是假融合。大型互联网企业的一次宕机,会造成多大影响?国外有网友这么回答:(以为)世界末日来了!这是4月15日Facebook、Instagram等平台的服务器大面积宕机故障之后,部分网民的吐槽,由此可见网络服务稳...

    Kyxy 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<