摘要:今日登录大陆手拿准备打怪升级,尼玛,没有数据怀疑自己昨晚太过劳累,于是他。。。睡着了每攻击一次睡一觉。是否是因为加密方式的区别于是他于是他。。。
今日Tbor登录linux大陆手拿Selenium+PhantomJS准备打怪升级,
尼玛, 没有数据?
Tbor怀疑自己昨晚太过劳累, 于是他。。。睡着了!每攻击一次睡一觉。男人嘛, 休息还是挺重要的!
import time from selenium import webdriver driver = webdriver.PhantomJS(executable_path="/home/Tbor/Desktop/phantomjs-2.1.1-linux-x86_64/bin/phantomjs") driver.get("https://www.baidu.com/") time.sleep(3) print driver.page_source
结果他发现, 这完全改变不了他肾亏的事实!
这可不是Tbor想要的, 第一反应可能自己被发现了, Tbor怀疑自己的脑袋(请求头)辨识度太高, 于是Tbor抬起自己手中的Selenium+PhantomJS启动伪装术
import time from selenium import webdriver from selenium.webdriver.common.desired_capabilities import DesiredCapabilities dcap = DesiredCapabilities.PHANTOMJS.copy() header = { "Accept":"text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8", "Accept-Encoding":"gzip, deflate, br", "Accept-Language":"zh-CN,zh;q=0.9", "Cache-Control":"max-age=0", "Connection":"keep-alive", "Cookie":"lsv=globalTjs_48e30dd-wwwTcss_cb39b0d-wwwBcss_483ee4a-framejs_2d8c954-globalBjs_8c0c610-sugjs_ddbaa53-wwwjs_5bf2601; plus_cv=1::m:caddfa4f; MSA_WH=320_568; ispeed_lsm=2; sug=3; sugstore=0; ORIGIN=0; bdime=0; BAIDUID=1A18D1CA8AAB7B0DDAAA0CC1CB239A9A:FG=1; BIDUPSID=1A18D1CA8AAB7B0DDAAA0CC1CB239A9A; PSTM=1524476137; B64_BOT=1; H_PS_645EC=a4beKut49tLxOMARLfm%2Fo6SdsqBYpvVfsiXBqLEPqjmyN6v9HOy5k06aQp8; BD_CK_SAM=1; PSINO=6; BDRCVFR[c3DJb-79z0f]=mk3SLVN4HKm; BD_HOME=0; H_PS_PSSID=26254_1424_21085_26106; BD_UPN=12314353", "Host":"www.baidu.com", "Upgrade-Insecure-Requests":"1", "User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.94 Safari/537.36", } for key, value in header.items(): dcap["phantomjs.page.customHeaders.{}".format( key)] = value driver = webdriver.PhantomJS(executable_path="/home/Tbor/Desktop/phantomjs-2.1.1-linux-x86_64/bin/phantomjs") driver.get("https://www.baidu.com/", desired_capabilities=dcap) time.sleep(3) print driver.page_source
一阵激斗, 烟雾散去
尼玛, 这么强悍的吗?不过Tbor什么场面没见过, 于是他跑了。。
Tbor回到了windows大陆, 用同样的招式
难道是因为自己英俊的脸庞, 于是Tbor回到家赶紧找镜子吗看看自己是否又变帅了!因为他觉得只有这个原因, 没有其他解释!他找到镜子, 镜子旁边, 他翻开了一本古籍!
“”PhantomJS使用的加密方式是SSLv3,有些网站用的是TLS。。。“”
是否是因为加密方式的区别?
于是他
import time from selenium import webdriver driver = webdriver.PhantomJS(service_args=["--ignore-ssl-errors=true", "--ssl-protocol=any"],executable_path="/home/Tbor/Desktop/phantomjs-2.1.1-linux-x86_64/bin/phantomjs") driver.get("https://www.baidu.com/") time.sleep(3) print driver.page_source
于是他。。。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/41591.html
摘要:而在不久前宣布支持模式而后跟随的新闻再次勾起我无尽的回忆。那么我们就来谈谈在和浏览器不原生支持模式下如何使用来实现模式进行动态数据的抓取。比较常见的例子在中进行转发。下面我们进行测试发现其可以正常的运行。 原文地址: http://52sox.com/python-use-h... 在Python中进行浏览器测试时,一般我们会选择selenium这样的库来简化我们工作量。而有些时候,为...
摘要:折腾了几天的终于部署到服务器上能生产使用了用篇文章来记录下部署过程中遇到的各种和坑。结语暂时想到的就这几个,如果有什么问题,可以直接在评论区回复,如果有其它解决方案或者错误之处,欢迎指出。 折腾了几天的WechatScraper终于部署到Linux服务器上能生产使用了用篇文章来记录下部署过程中遇到的各种bug和坑。 1. 运行问题 webdriver在有GUI界面的系统上运行是只需要下...
摘要:以及是一个用于应用程序测试的工具。测试直接运行在浏览器中,就像真正的用户在操作一样。是一个服务器端的的。其支持各种标准处理选择器和。官网给的这个实际跑起来有点问题,报错需要更换一下验证的各种数据抓取的艺术一数据抓取环境配置 序 PhantomJS是个好东东,很多时候爬虫需要用到,但是这个有windows、linux、mac的版本,想要跨平台的话,需要自己再处理一下,幸好有了phanbe...
摘要:使用实现网页截屏查库发邮件的。本是用于发周报邮件的,周报内容包括数据库中的记录以及网页指定元素的截屏。用于网页截屏,用于传递参数。注意其中使用截取中为的元素的操作。 使用python(2.7)实现网页截屏、查库、发邮件的demo。用到了selenium、phantomjs、mailer、jinja2、mysqldb还有image,都是比较典型的用法,可复用性比较强,记录分享一下。 本d...
摘要:项目简介本实验通过使用实现一个淘宝女郎图片收集爬虫,学习并实践及正则表达式等知识。本教程由阿发布在实验楼,完整教程及在线练习地址实现淘女郎照片爬虫,可以直接在教程中下载代码使用。 showImg(https://segmentfault.com/img/bVBgrF); 项目简介:本实验通过使用 Python 实现一个淘宝女郎图片收集爬虫,学习并实践 BeautifulSoup、Sel...
阅读 1284·2023-04-25 23:22
阅读 1682·2023-04-25 20:04
阅读 2655·2021-11-22 15:24
阅读 2820·2021-11-11 16:54
阅读 1894·2019-08-30 14:03
阅读 1494·2019-08-29 16:35
阅读 1714·2019-08-26 10:29
阅读 2684·2019-08-23 18:01