? 作者主页:不吃西红柿
? 简介:CSDN博客专家?、信息技术智库公号作者✌简历模板、PPT模板、技术资料尽管【关注】私聊我。历史文章目录:https://t.1yb.co/zHJo
? 欢迎点赞 ? 收藏 ⭐留言 ? 如有错误敬请指正!
本文重点:
1、爬虫获取csdn大佬之间的关系
2、可视化分析暧昧关系,复杂堪比娱乐圈
大佬简介
? Java李杨勇:一个性感的计算机专业毕业的3年java开发者。
? 沉默王二:CSDN 头牌博主,Java 领域优质创作者,2019、2020 两届博客之星 Top5 。
? 擦姐yyds:现象级专栏 《Python 爬虫 100 例》作者、《滚雪球学 Python 专栏》原创者。
? 涛歌依旧:涛哥不知何许人也,亦不详其姓字。闲静少言,不慕荣利。好读书,求甚解。
? Lucifer三思而后行:灵感来源于生活,故而热爱生活~
? 曲鸟:python领域新星创作者。
? 孤寒者:深入浅出的讲解Python基础知识&爬虫初阶及进阶&主流Web框架(Django等)
? 肥学大师:目前还是学生喜欢分享从每个项目得到的技术和趣闻类的文章。
不甚枚举......
目录
我们尤其可以看到:
这个「不吃西红柿」竟然关注了所有人,简直是朵交际花,不仅文章写得好,还爱交朋友! 据说,他最近有评论必回关 ❤
C站的关注api:
https://blog.csdn.net/community/home-api/v1/get-follow-list?page=%s&size=20&noMore=false&blogUsername=%s"%(p,Username)
需要传入两个参数:页数、用户id
%(p,Username)
还是经典的爬虫包: import requests
def get_follow(Username): headers = { "User-Agent": "Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; WOW64; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; .NET4.0C; InfoPath.3)", "accept": "application/json, text/javascript, */*; q=0.01", "accept-encoding": "gzip, deflate, br", "accept-language": "zh-CN,zh;q=0.9", "content-type": "application/x-www-form-urlencoded; charset=UTF-8", "cookie": "cookie", } data ={ "page": "1", "size": "20", "noMore": "false", "blogUsername": Username } follow_list = [] for p in range(1,101): url = "https://blog.csdn.net/community/home-api/v1/get-follow-list?page=%s&size=20&noMore=false&blogUsername=%s"%(p,Username) res = requests.get(url,headers=headers,data=data) fans = json.loads(res.text)["data"]["list"] if fans: follow_list.extend(fans) else: break ff = [] for i in follow_list: ff.append(i["username"]) return ff
def graph(nodes, links): graph = Graph() graph.add("Name:", nodes,links, repulsion=8000) graph.set_global_opts(title_opts=opts.TitleOpts("关系图")) graph.render() #生成render.html
if __name__ == "__main__": nodes,links = [],[] blog = { "weixin_39032019": "不吃西红柿", "Mancuojie":"Mancuojie", "weixin_39709134": "Java李杨勇", "zhongguomao": "SAP剑客", "qing_gee": "沉默王二", "hihell": "擦姐yyds", "stpeace": "涛歌依旧", "jacke121": "AI视觉网奇", "weixin_40400177": "DrogoZhang", "m0_50546016": "Lucifer三思而后行", "momoda118": "曲鸟大师", "qq_44907926": "孤寒大佬", "jiahuiandxuehui": "肥学大师", } blog_key = blog.keys() for blogUsername in blog: follows = get_follow(blogUsername) simple_follows = [val for val in follows if val in blog_key] nodes.append({"name": blog[blogUsername] }) for one in simple_follows: if blog[blogUsername] != blog[one]: links.append({"source": blog[blogUsername] ,"target":blog[one] }) print(links) graph(nodes,links)
好了,今天的「爬虫」和「数据可视化」小课堂,就到这里了,我是西红柿?,我们下期再见~
热门专栏推荐:
? 大数据集锦专栏:大数据-硬核学习资料 & 面试真题集锦
? 数据仓库专栏:数仓发展史、建设方法论、实战经验、面试真题
? Python专栏:Python相关黑科技:爬虫、算法、小工具
(优质好文持续更新中……)✍
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/118776.html
❤️大佬都在学什么?Python爬虫分析C站大佬收藏夹,跟着大佬一起学,你就是下一个大佬❤️! 前言程序说明数据爬取获取 CSDN 作者总榜数据获取收藏夹列表获取收藏数据爬虫程序完整代码爬取数据结果 数据分析及可视化 前言 计算机行业的发展太快了,有时候几天不学习,就被时代所抛弃了,因此对于我们程序员而言,最重要的就是要时刻紧跟业界动态变化,学习新的技术,但是很多时候我们又不知道学什么好,万...
☀️苏州程序大白一文从基础手把手教你Python数据可视化大佬☀️《❤️记得收藏❤️》 目录 ?️?开讲啦!!!!?️?苏州程序大白?️??博主介绍前言数据关系可视化散点图 Scatter plots折线图强调连续性 Emphasizing continuity with line plots同时显示多了图表 数据种类的可视化 Plotting with categorical da...
摘要:我是布小禅,一枚自学萌新,跟着我每天进步一点点吧说了这么多暂时也就够了,那么就告辞吧 文章目录 ☀️ 前言 ☀️? 作者简介 ??文件操作?1️⃣、open函数...
摘要:标签不区分大小写,但推荐小写。标签可以嵌套,但不能交叉嵌套。标签也称为元素。比如行内标签亦可成行内元素。 ❤️HTML必备知识详解❤️ 第一部分:HTML框架简介...
阅读 3359·2021-11-24 09:38
阅读 1363·2021-11-22 15:08
阅读 1415·2021-09-29 09:35
阅读 444·2021-09-02 15:11
阅读 1267·2019-08-30 12:55
阅读 352·2019-08-29 17:16
阅读 465·2019-08-29 11:30
阅读 376·2019-08-26 13:23