摘要:一键生成属于自己的历史报告,看看你对自己的了解程度有多深简介近几年,由于微信的流行,大部分人不再频繁使用,所以我们对于自己的数据并不是特别了解。这里要说明的是,加密函数的获取,需要具备一定的抓包基础才能获取得到。
[TOC]
一键生成属于自己的QQ历史报告,看看你对自己的QQ了解程度有多深? 简介近几年,由于微信的流行,大部分人不再频繁使用QQ,所以我们对于自己的QQ数据并不是特别了解。我相信,如果能够生成一份属于自己的QQ历史报告,那将是无比开心的一件事。
目前网上关于QQ的数据分析工具较少,原因是QQ相关接口比较复杂。而本程序的运行十分简单,具有良好的用户交互界面,只需要扫码登录一步操作即可。
目前本程序获取的数据包括:QQ详细数据、手机在线时间、非隐身状态下在线时间、QQ活跃时间、单向好友数量、QQ财产分析、群聊分析、过去一年我退出的群聊数据、退去一个月我删除的好友数据、所有代付信息、我最在意的人以及最在意我的人。由于相关的数据接口有访问限制,所以本程序并没有对QQ好友进行分析。
功能截图# 跳转到当前目录 cd 目录名 # 先卸载依赖库 pip uninstall -y -r requirement.txt # 再重新安装依赖库 pip install -r requirement.txt # 开始运行 python main.py编写思路
本程序分为多个模块,模块如下:
main.py,主程序,用于获取并处理相关数据,并导出数据报告。
qq_bot.py, 核心模块,实现了qq相关的接口,较为复杂。
tkinter_gui.py,绘制gui模块,使用tkinter绘制基本的交互界面。
static_data.py,数据存储模块,所有数据采用base64编码存储。
main.py模块首先,初始化相关文件夹,并调用qq_bot.py模块,定义一个qq bot对象,该对象为本程序的核心对象,所有数据获取均从该对象获取。
同时,本程序数据的报告文件为.md格式
# 初始化文件夹 init_folders() # 写入项目所需资源文件到本地目录 write_data() # 创建一个自己编写的qq bot对象 bot = Bot() custom_print(u"登录成功,正在获取数据...") # 定义欲输出的markdown字符串 markdown_content = """{qq_number}的个人QQ历史报告
" + "## 我的详细资料 " + "种类|内容 :- | :- " for key, value in detail_information.items(): if key == "qq_level": star_count, moon_count, sun_count, crown_count = calculate_level(value) data = crown_count * "![](data/level_crown.png)" + sun_count * "![](data/level_sun.png)" + moon_count * "![](data/level_moon.png)" + star_count * "![](data/level_star.png)" content += "{}|{} ".format(key_dict[key], data) else: content += "{}|{} ".format(key_dict[key], value) # 更新一下欲输出的markdown文本 markdown_content += content markdown_content += " > 注:单向好友表示他/她的列表中有你,而你的列表中没有他/她" # 每个步骤完成后,保存markdown文件,以便防止程序出错时能够保存到最新的数据 with open("{}的个人QQ历史报告.md".format(bot.qq_number), "w", encoding="utf-8") as file: file.write(markdown_content)
接着,获取所有qq好友的备注名和qq号
all_qq_friends = bot.get_all_friends_in_qq() custom_print(u"所有qq好友号码和备注名中...") qq_number_list = [] for key, friend_group in all_qq_friends.items(): for info in friend_group["mems"]: qq_number_list.append(info["uin"])
并获取所有群数据
# 获取所有群信息 custom_print(u"获取该QQ加入的所有群信息...") group_list = bot.get_group() print(group_list) # content为markdown语法文本 content = "
" + "## 我加入的群资料 " + "序号|群名|群号|群主QQ :- | :-| :-| :- " # 获取某个群的群成员信息 for index, group in enumerate(group_list): group_number = group["gc"] group_name = group["gn"] owner = group["owner"] content += "{}|{}|{}|{} ".format(str(index+1), str(group_name), str(group_number), str(owner)) # 更新一下欲输出的markdown文本 markdown_content += content # 每个步骤完成后,保存markdown文件,以便防止程序出错时能够保存到最新的数据 with open("{}的个人QQ历史报告.md".format(bot.qq_number), "w", encoding="utf-8") as file: file.write(markdown_content)
接下来的步骤如你所需,也就是获取其他相关的数据,所以本小节就不一一详细解释了,您可以查看相关源代码查看。获取的数据包括:
获取过去30天内退出的群名单
获取过去364天内删除的好友名单
判断此次登录的qq是否为vip或者svip
获取qb值
获取代付信息
亲密度排行榜
共同好友数
成为好友的天数
qq_bot模块此模块实现了获取qq数据的接口,主要通过抓包获得数据、分析数据,对参数进行加密解密等。
首先,是模拟扫码登录id.qq.com,qun.qq.com,qzone.qq.com。三者登录方式大同小异,唯一有区别的就是提交数据中的参数加密方式不同。
我们以id.qq.com登录为例:
def login_id_qq_com(self): # 登录id.qq.com # 访问网页,为了获取参数pt_login_sig login_url = "https://xui.ptlogin2.qq.com/cgi-bin/xlogin?pt_disable_pwd=1&appid=1006102&daid=1&style=23&hide_border=1&proxy_url=https://id.qq.com/login/proxy.html&s_url=https://id.qq.com/index.html" html = get_html(login_url, "") # 对返回的cookies进行转化为dict类型,方便处理 cookies_back_dict = dict_from_cookiejar(html.cookies) pt_login_sig = cookies_back_dict["pt_login_sig"] self.cookies_merge_dict_in_id_qq_com.update(cookies_back_dict) # 访问网页,为了获取参数ptqrtoken qrcode_url = "https://ssl.ptlogin2.qq.com/ptqrshow?appid=1006102&e=2&l=M&s=4&d=72&v=4&t=0.10239549811477189&daid=1&pt_3rd_aid=0" html = get_html(qrcode_url, "") # 对返回的cookies进行转化为dict类型,方便处理 cookies_back_dict = dict_from_cookiejar(html.cookies) qrsig = cookies_back_dict["qrsig"] ptqrtoken = hash33_token(qrsig) self.cookies_merge_dict_in_id_qq_com.update(cookies_back_dict) # 将二维码显示到图片框 BytesIOObj = BytesIO() BytesIOObj.write(html.content) qr_code = PIL.Image.open(BytesIOObj) image = PIL.ImageTk.PhotoImage(qr_code) image_label["image"] = image # 实时检测二维码状态 while (True): # 目标网址 target_url = "https://ssl.ptlogin2.qq.com/ptqrlogin?u1=https://id.qq.com/index.html&ptqrtoken=" + str(ptqrtoken) + "&ptredirect=1&h=1&t=1&g=1&from_ui=1&ptlang=2052&action=0-0-1556812236254&js_ver=19042519&js_type=1&login_sig=" + str(pt_login_sig) + "&pt_uistyle=40&aid=1006102&daid=1&" # 登录,需要带上访问cookies html = get_html(target_url, self.cookies_merge_dict_in_id_qq_com) # 返回的响应码为200说明二维码没过期 if (html.status_code): if ("二维码未失效" in html.text): custom_print(u"(1/3)登录id.qq.com中,当前二维码未失效,请你扫描二维码进行登录") elif ("二维码认证" in html.text): custom_print(u"(1/3)登录id.qq.com中,扫描成功,正在认证中") elif ("登录成功" in html.text): self.is_login = True custom_print(u"(1/3)登录id.qq.com中,登录成功") break if ("二维码已经失效" in html.text): custom_print(u"(1/3)登录id.qq.com中,当前二维码已失效,请重启本软件") exit() # 延时 time.sleep(2) # 登录成功后,把返回的cookies合并进去 self.cookies_merge_dict_in_id_qq_com = dict_from_cookiejar(html.cookies) self.cookies_merge_dict_in_id_qq_com.update(cookies_back_dict) # print(u"当前cookies:{}".format(cookies_merge_dict)) # 获取此次登录的qq号码 qq_list = re.findall(r"&uin=(.+?)&service", html.text) self.qq_number = qq_list[0] # 登录成功后,会返回一个地址,需要对该地址进行访问以便获取新的返回cookies startIndex = (html.text).find("http") endIndex = (html.text).find("pt_3rd_aid=0") url = (html.text)[startIndex:endIndex] + "pt_3rd_aid=0" # 屏蔽https证书警告 urllib3.disable_warnings() # 这里需要注意的是,需要禁止重定向,才能正确获得返回的cookies html = get(url, cookies=self.cookies_merge_dict_in_id_qq_com, allow_redirects=False, verify=False) # 把返回的cookies合并进去 cookies_back_dict = dict_from_cookiejar(html.cookies) self.cookies_merge_dict_in_id_qq_com.update(cookies_back_dict)
首先是访问指定网址,获取参数pt_login_sig,其次是访问另外一个网址,获取参数qrsig,通过加密函数,将参数qrsig转化为ptqrtoken,然后就是获取二维码图片的状态了。当我们检测到登录成功时,就证明用户已经完成扫码操作,此时将网址返回的cookie保存下来。
这里要说明的是,加密函数的获取,需要具备一定的抓包基础才能获取得到。本程序的几个加密函数如下:
# 对qrsig进行基本的加密,该加密函数由抓包获得,需要具备一定抓包知识才能找到该加密函数 # 根据javascript版的加密函数,将其改写成python版本 def hash33_token(t): e, n = 0, len(t) for i in range(0,n): e += (e << 5) + ord(t[i]) return 2147483647 & e # 对skey进行基本的加密,该加密函数由抓包获得,需要具备一定抓包知识才能找到该加密函数 # 根据javascript版的加密函数,将其改写成python版本 def hash33_bkn(skey): e = skey t = 5381 for n in range(0,len(e)): t += (t << 5) + ord(e[n]) return 2147483647 & t
由于该模块下具有许多获取相关数据的qq接口,但是它们的形式非常相似,所以本节仅仅以获取所有qq群数据为例:
def get_group(self): # 获取所有群基本信息 # bkn由参数skey通过另一个加密函数得到 bkn = hash33_bkn(self.cookies_merge_dict_in_qun_qq_com["skey"]) submit_data = {"bkn": bkn} html = post_html("https://qun.qq.com/cgi-bin/qun_mgr/get_group_list", self.cookies_merge_dict_in_qun_qq_com, submit_data) group_info = loads(html.text) print(group_info) return group_info["join"]
这里主要涉及到的还是参数的加密、解密过程,这是一个难点,其他的话还是比较简单的。
tkinter_gui模块这个模块是绘制基本的gui模块,采用python内置的tkinter模块完成,用法相当简单,这里就不详细讲了。
static_data模块这个模块主要是用来存储相关的数据的,在程序每次运行时,将该静态资源文件输出。这么做的原因是可以防止用户将某些静态数据给删除了,导致程序运行错误。
补充完整版源代码存放在github上,有需要的可以下载
项目持续更新,欢迎您star本项目
LicenseThe MIT License (MIT)
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/43840.html
摘要:为什么我又要重新开始写机器学习相关的文章了最主要的原因是现在的机器学习和五年前十年前区别很大。深度学习带来了什么深度学习最重要的东西就是自带了特征学习,有时候也被翻译为表征学习,简单来说就是,不需要进行特别的特征抽取。 1.为什么我开始写这个系列博客说五年前我还在某A云公司的时候,身在一个机器学习算法组,对机器学习怀有浓厚的兴趣。花了好多的时间来试图搞清楚各种流行的机器学习算法,经常周末也跟...
摘要:一键生成微信个人专属数据报告了解你的微信社交历史简介你是否想过生成一份属于你的微信个人数据报告,了解你的微信社交历史。 [TOC] 一键生成微信个人专属数据报告,了解你的微信社交历史 简介 你是否想过生成一份属于你的微信个人数据报告,了解你的微信社交历史。现在,我们基于python对微信好友进行全方位数据分析,包括:昵称、性别、年龄、地区、备注名、个性签名、头像、群聊、公众号等。 其中...
摘要:一键生成微信个人专属数据报告了解你的微信社交历史简介你是否想过生成一份属于你的微信个人数据报告,了解你的微信社交历史。 [TOC] 一键生成微信个人专属数据报告,了解你的微信社交历史 简介 你是否想过生成一份属于你的微信个人数据报告,了解你的微信社交历史。现在,我们基于python对微信好友进行全方位数据分析,包括:昵称、性别、年龄、地区、备注名、个性签名、头像、群聊和公众号等。 其中...
摘要:月日,首期沙龙海量运维实践大曝光在腾讯大厦圆满举行。织云高效的实践是,它是以运维标准化为基石,以为核心的自动化运维平台。 作者丨周小军,腾讯SNG资深运维工程师,负责社交产品分布式存储的运维及团队管理工作。对互联网网站架构、数据中心、云计算及自动化运维等领域有深入研究和理解。 12月16日,首期沙龙海量运维实践大曝光在腾讯大厦圆满举行。沙龙出品人腾讯运维技术总监、复旦大学客座讲师、De...
摘要:大数据分析技术在的数据感应结果分析中起到了非常重要的作用。我们针对它制定的计划以及我们所用的标签其实源自于谷歌和其他大规模基础设施。不幸地是,那些技术完全被大数据这个被过度使用的营销语掩盖了。 大数据分析技术在CloudPhysics的数据感应结果分析中起到了非常重要的作用。这是Willem ter Harmsel采访Cloud Physics的首席执行官约翰布卢门塔尔(John Blum...
阅读 2610·2021-09-09 09:33
阅读 2789·2019-08-30 15:54
阅读 2839·2019-08-30 14:21
阅读 2339·2019-08-29 17:15
阅读 3554·2019-08-29 16:13
阅读 2703·2019-08-29 14:21
阅读 3402·2019-08-26 13:25
阅读 1968·2019-08-26 12:14