摘要:完成可视化热搜榜和国内疫情新增图,提高学生的编程能力和分析问题解决问题的能力。下图为百度微博知乎三大平台的热搜词频统计图。后续我会补上薄弱项,为争取做一名全栈技术人员而奋斗。
通过该实验把Python语言中基本知识和第三方库得到综合应用。完成可视化热搜榜和国内疫情新增图,提高学生的编程能力和分析问题、解决问题的能力。
硬件:多媒体计算机 软件:Windows7或Windows10 操作系统、Python3.X 软件。
1、 实验内容
① 使用python web框架flask搭建web项目
② 使用爬虫技术完成信息获取
③ 使用python基础知识库完成数据转换并做数据分析
④ 使用jieba库对热搜做词频分析
⑤ 使用jQuery框架和HTML、css、JavaScript和echarts完成前端页面设计
2、最后结果输出。要求:输出格式要界面直观、清晰大方、格式规范。
#构建首页页面路由路径,并加载index.html页面和传送数据@app.route("/Hot_Bot")def Hot_Bot(): data=hotBot() return render_template("index.html",form=data,title=data.title)#构建词频页面和路由路径,并加载test.html页面和传送数据@app.route("/cipin")def cipin(): data=spider.sum_hot_word() print(data) return render_template("test.html",form=data)
爬虫阶段以微博和知乎为例:def weibo(): hot=[] name=[] value=[] url="https://weibo.com/ajax/statuses/hot_band" header={ "cookie": "UOR=mp.weixin.qq.com,s.weibo.com,mp.weixin.qq.com; SINAGLOBAL=753710676249.8569.1621750150925; SUB=_2AkMXpEktf8NxqwJRmP4Tz2zkZYh3wwHEieKh-Lj2JRMxHRl-yT9jqhAztRB6PCRnwgM0JsVYPTwi5DuGI3N0YpgPChkI; SUBP=0033WrSXqPxfM72-Ws9jqgMF55529P9D9WhpfXwV9S99niOF07XLn8y7; WBPSESS=kErNolfXeoisUDB3d9TFH-1YhWD5pAkKF4olmR2WdEz_79spnMzQbf2Kt92964Tdvd3fcKY1c8a_Sd6CbCiw6P0wyFuEu1GQri6NrQ6_oBLuAYd8HR3zZI8_M6QfSsHD; ULV=1635245354703:3:1:1:6287771993091.978.1635245354698:1626916415441; XSRF-TOKEN=_LdujowesXEM4itQidVLNlJj", "accept - encoding": "gzip, deflate, br", "user - agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36", "referer": "https://www.baidu.com/link?url=oBKJ9ZCKdgcrDL-WKTnXNgHhk2kNw6JfV0tShTgwv3KYkUracwd2FG6kuIrShm5b2aJDHZKZVgYG8QgZWSM-Ha&wd=&eqid=f74c877700049c31000000066177abe3" } req = requests.get(url,headers=header).text soup = BeautifulSoup(req, "lxml") #hot_word = re.findall("word.*?,",req) hot_word=json.loads(req)["data"]["band_list"] for i in range(len(hot_word)): hot.append({"name":hot_word[i]["word"][0:10],"value":hot_word[i]["num"]}) name.append(hot_word[i]["word"]) value.append(hot_word[i]["num"]) return hot[0:3],name,value
def zhihu(): hot = [] browser=webdriver.Chrome("chromedriver.exe") browser.get("https://www.zhihu.com/topsearch") browser.refresh() elements=browser.find_elements_by_class_name("TopSearchMain-title") for i in elements: hot.append(i.text) return hot
以词频分析为例展示部分前端页面代码:<div id="main" style="width: 600px;height: 800px;"></div><script> var ectest = echarts.init(document.getElementById("main")); var ec_right2_option = { // backgroundColor: "#515151", title: { text: "今日疫情热搜", textStyle: { color: "white", }, left: "left" }, tooltip: { show: false }, series: [{ type: "wordCloud", // drawOutOfBound:true, gridSize: 1, sizeRange: [12, 55], rotationRange: [-45, 0, 45, 90], // maskImage: maskImage, textStyle: { normal: { color: function () { return "rgb(" + Math.round(Math.random() * 255) + ", " + Math.round(Math.random() * 255) + ", " + Math.round(Math.random() * 255) + ")" } } }, right: null, bottom: null, data: ffffd }] } ectest.setOption(ec_right2_option);</script>
下面展示主页面:
中间是国内疫情新增图并动态显示人数,左上为百度热搜榜top3、左下为微博热搜榜top3、中上为当天天气情况、右上为微博和百度热搜热度对比。右下为三大平台的热搜地址和词频统计。
下图为百度、微博、知乎三大平台的热搜词频统计图。
通过本次课程设计我又温习了一次python的一些基础知识而且对前端技术有了进一步的了解使我更加清晰了以后的方向。而且也认识到在构建项目的时候对整体架构的重要性,最重要的是更深的认识到python技术对于构建网站的优缺点和python语言的实用性。对以后的发展起到了良好的引导作用。同时也认识到了自己的薄弱项,比如在前端页面设计的时候对jQuery和JavaScript技术的应用很不熟练还有对echarts的图表选择也比较简单,在选取疫情城市坐标标记的时候对symbolSize
的设定也没有把控好直接导致了最终产品没有达到预期效果,而且对python的基础知识掌握也不是特别的牢固对于jieba库的使用还有待提高。后续我会补上薄弱项,为争取做一名全栈技术人员而奋斗。
这里有python,Java学习资料还有有有趣好玩的编程项目,更有难寻的各种资源。反正看看也不亏。 回复可视化热搜榜和疫情新增图
特别介绍
?小白练手专栏,适合刚入手的新人欢迎订阅编程小白进阶
?python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章,可以让你快乐学python练手项目专栏
?另外想学JavaWeb进厂的同学可以看看这个专栏:传送们
?这是个面试和考研的算法练习我们一起加油上岸之路
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/123084.html
摘要:基于此,我爬取了淘宝上多条月饼的销售数据,为大家展示了一幅漂亮的可视化大屏,解决大家心目中的问题。模块的安装与配置这次爬取淘宝,采用的是最简单的方式控制浏览器进行自动化操作,中途只需要扫码登陆一次,即可完成整个数据的爬取。 ...
摘要:明确了客服调度的核心问题,也知道了难点,更看到了目前的现状后,我们决定打造一款自动智能的客服调度系统。对于社会化的云客服,我们可以做到,比如排队数超过某值时,自动触发云客服的应急放班。 背景 为什么客服需要调度?阿里集团客户体验事业群(CCO)目前承接了阿里集团以及生态体的客户服务业务,我们的客户通过各个渠道来寻求解决各类问题,每天的进线量巨大,而且经常伴随着突发性进线,比如天猫代金券...
摘要:今天,我们邀请阿里高级技术专家力君,为大家分享自动智能的客服调度系统。明确了客服调度的核心问题,也知道了难点,更看到了目前的现状后,我们决定打造一款自动智能的客服调度系统。 小叽导读:提到调度,大家脑海中可能想起的是调度阿里云的海量机器资源,而对于阿里集团客户体验事业群(CCO)而言,我们要调度的不是机器,而是客服资源。今天,我们邀请阿里高级技术专家力君,为大家分享自动、智能的客服调度...
阅读 3429·2021-11-12 10:36
阅读 2740·2021-11-11 16:55
阅读 2960·2021-09-27 13:36
阅读 1617·2021-08-05 10:01
阅读 3558·2019-08-30 15:55
阅读 767·2019-08-30 13:01
阅读 1909·2019-08-29 17:16
阅读 2377·2019-08-29 16:40