资讯专栏INFORMATION COLUMN

某数加密的流程与原理简析

dkzwm / 2061人阅读

摘要:前言啃了这么长时间,基本上已经把某数的套路摸了个八九不离十,不愧是中国反爬界的集大成者,感觉收获满满,这里就简单记录一下分析成果。注意某数在不同的网站上有不同的版本,其流程也略有不同,这里的流程不一定适用于其它网站。

前言

啃了这么长时间,基本上已经把某数的套路摸了个八九不离十,不愧是中国反爬界的集大成者,感觉收获满满,这里就简单记录一下分析成果。
注意:某数在不同的网站上有不同的版本,其流程也略有不同,这里的流程不一定适用于其它网站。

工具和资料

QQ群 - Javascript高级爬虫 - 作者自建群,欢迎加入!

中国商标网加密接口 - 仅作演示

之前的文章1 - 记录了之前尝试的其它方法

之前的文章2 - 对加密混淆后的js的一些初步分析

awesome-java-crawler - 我收集的爬虫相关工具和资料

java-curl - 我编写的java HTTP库

另一个用了某数加密的网站的破解SDK

前端流程

请求页面,返回应答;如果有之前生成的有效FSSBBIl1UgzbN7N80T cookie值,请求时须带上。

应答的html中,包含以下关键数据:

元素的content,这是加密后的数据,里面包含字符串映射表、全局方法映射表、加解密算法密钥等;注意有些网站的meta.id不同

阅读需要支付1元查看
<