摘要:概要应同学邀请,演示如何使用内嵌浏览器浏览网页,并注入脚本实现自动化操作。在默认配置中植入内容,这样脚本会在所有打开的网页中执行,不论跳转到哪个网址。脚本使用网址中的路径名,判断当前网页位置,从而决定执行哪种操作。
概要
应同学邀请,演示如何使用 PyQt5 内嵌浏览器浏览网页,并注入 Javascript 脚本实现自动化操作。
sg 原贴地址: 如何在Python利用runJavaScript模拟鼠标移动页面的某个元素
https://segmentfault.com/q/10...
下面测试的是一个廉价机票预订网站(http://www.flyscoot.com/),关键点如下
使用 QWebEngineView 加载网页,并显示进度。
在默认配置(QWebEngineProfile)中植入 Javascript 内容,这样脚本会在所有打开的网页中执行,不论跳转到哪个网址。
Javascript 脚本使用网址中的路径名,判断当前网页位置,从而决定执行哪种操作。
python 代码示例#!/usr/bin/env python3 # -*- coding: utf-8 -*- """使用 PyQt5 内嵌浏览器浏览网页,并注入 Javascript 脚本实现自动化操作。""" import os import sys from datetime import datetime from PyQt5.QtWidgets import ( QWidget, QApplication, QVBoxLayout, QHBoxLayout, QDesktopWidget, QTextEdit, QLabel, QLineEdit, QPushButton, QFileDialog, QProgressBar, ) from PyQt5.QtCore import QUrl, pyqtSlot from PyQt5.QtWebEngineWidgets import QWebEngineView, QWebEngineProfile, QWebEngineScript, QWebEnginePage class Browser(QWidget): def __init__(self): super().__init__() self.init_ui() # 脚本 self.profile = QWebEngineProfile.defaultProfile() self.script = QWebEngineScript() self.prepare_script() def init_ui(self): self.webView = QWebEngineView() self.logEdit = QTextEdit() self.logEdit.setFixedHeight(100) self.addrEdit = QLineEdit() self.addrEdit.returnPressed.connect(self.load_url) self.webView.urlChanged.connect( lambda i: self.addrEdit.setText(i.toDisplayString())) self.jsEdit = QLineEdit() self.jsEdit.setText("inject.js") loadUrlBtn = QPushButton("加载") loadUrlBtn.clicked.connect(self.load_url) chooseJsBtn = QPushButton("选择脚本文件") chooseJsBtn.clicked.connect(self.choose_js_file) # 导航/工具 top = QWidget() top.setFixedHeight(80) topBox = QVBoxLayout(top) topBox.setSpacing(0) topBox.setContentsMargins(5, 0, 0, 5) progBar = QProgressBar() progBox = QHBoxLayout() progBox.addWidget(progBar) topBox.addLayout(progBox) naviBox = QHBoxLayout() naviBox.addWidget(QLabel("网址")) naviBox.addWidget(self.addrEdit) naviBox.addWidget(loadUrlBtn) topBox.addLayout(naviBox) naviBox = QHBoxLayout() naviBox.addWidget(QLabel("注入脚本文件")) naviBox.addWidget(self.jsEdit) naviBox.addWidget(chooseJsBtn) topBox.addLayout(naviBox) self.webView.loadProgress.connect(progBar.setValue) # 主界面 layout = QVBoxLayout(self) layout.addWidget(self.webView) layout.addWidget(top) layout.addWidget(self.logEdit) self.show() self.resize(1024, 900) self.center() def center(self): qr = self.frameGeometry() cp = QDesktopWidget().availableGeometry().center() qr.moveCenter(cp) self.move(qr.topLeft()) @pyqtSlot() def load_url(self): url = self.addrEdit.text().strip() if not url.lower().startswith("http://") and not url.lower().startswith("https://"): url = "http://{}".format(url) self.load(url) @pyqtSlot() def choose_js_file(self): f, _ = QFileDialog.getOpenFileName(filter="Javascript files(*.js)") if os.path.isfile(f): self.jsEdit.setText(f) self.prepare_script() def prepare_script(self): path = self.jsEdit.text().strip() if not os.path.isfile(path): self.log("invalid js path") return self.profile.scripts().remove(self.script) with open(path, "r") as f: self.script.setSourceCode(f.read()) self.profile.scripts().insert(self.script) self.log("injected js ready") def log(self, msg, *args, **kwargs): m = msg.format(*args, **kwargs) self.logEdit.append("{} {}".format( datetime.now().strftime("%H:%M:%S"), m)) def load(self, url): self.log(f"loading {url}") self.addrEdit.setText(url) self.webView.load(QUrl(url)) if __name__ == "__main__": app = QApplication(sys.argv) b = Browser() b.load("http://www.flyscoot.com/") sys.exit(app.exec_())Javascript 脚本示例
// 简单起见,这里只演示部分页面,脚本内容摘自 Heng丶原贴文。 function handle(path) { // 首页 if (path == "/zh") { document.getElementsByClassName("radio-inline")[1].click(); document.getElementById("oneway_from").value="广州 (CAN)"; document.getElementById("oneway_to").value="新加坡 (SIN)"; document.getElementById("oneway_departuredate").value="2018年9月10日"; document.getElementsByClassName("btn--booking")[1].click(); return; } // 选择航班 if (path == "/Book/Flight") { document.getElementsByClassName("price--sale")[0].click(); document.getElementsByClassName("heading-4")[0].click(); document.getElementsByClassName("btn-submit")[0].click(); return; } // 乘客信息 if (path == "/BookFlight/Passengers") { document.getElementsByClassName("fname1")[0].value = "匿名"; } } let host = document.location.hostname; if (host.endsWith(".flyscoot.com")) { handle(document.location.pathname); }
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/42341.html
摘要:跨域请求跨域问题,是开发中一直以来需要注意的问题。则发送通道的发送给监听此消息的外部扩展。完整方法此处,为必选参数,为回调函数。回调函数接收到的参数有三个,分别是和,即消息内容,消息发送者相关信息和相应函数。是发起消息的标签。 第二章简介 第二章较第一章复杂许多。书中虽寥寥21页,内容却也不少。涵盖了8个小节。 2.1 操作用户正在浏览的页面 2.2 跨域请求 2.3 常驻后台 2....
摘要:在浏览区中的性能,可以认为是开发者所面临的最严重的可用性问题。优化这个问题的第一步从它的加载和执行开始。这意味着在对象的事件触发后再下载脚本。属性指明本元素所含的脚本不会修改,因此代码能够安全地执行,但是浏览器的支持情况不理想。 JavaScript在浏览区中的性能,可以认为是开发者所面临的最严重的可用性问题。 优化这个问题的第一步从它的加载和执行开始。 霸道的script标签scr...
摘要:是代替用户完成指定的动作,需要知道其他用户页面的代码和数据包。 常见web安全及防护原理 sql注入原理 就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串,最终达到欺骗服务器执行恶意的SQL命令 总的来说有以下几点 永远不要信任用户的输入,要对用户的输入进行校验,可以通过正则表达式,或限制长度,对单引号和双-进行转换等 永远不要使用动态拼装SQL,可以...
阅读 2632·2021-10-14 09:47
阅读 4909·2021-09-22 15:52
阅读 3355·2019-08-30 15:53
阅读 1428·2019-08-30 15:44
阅读 669·2019-08-29 16:41
阅读 1646·2019-08-29 16:28
阅读 439·2019-08-29 15:23
阅读 1618·2019-08-26 12:20