资讯专栏INFORMATION COLUMN

PyQt5 内嵌浏览器注入 Javascript 脚本实现自动化操作

xiguadada / 2037人阅读

摘要:概要应同学邀请,演示如何使用内嵌浏览器浏览网页,并注入脚本实现自动化操作。在默认配置中植入内容,这样脚本会在所有打开的网页中执行,不论跳转到哪个网址。脚本使用网址中的路径名,判断当前网页位置,从而决定执行哪种操作。

概要

应同学邀请,演示如何使用 PyQt5 内嵌浏览器浏览网页,并注入 Javascript 脚本实现自动化操作。

sg 原贴地址: 如何在Python利用runJavaScript模拟鼠标移动页面的某个元素
https://segmentfault.com/q/10...

下面测试的是一个廉价机票预订网站(http://www.flyscoot.com/),关键点如下

使用 QWebEngineView 加载网页,并显示进度。

在默认配置(QWebEngineProfile)中植入 Javascript 内容,这样脚本会在所有打开的网页中执行,不论跳转到哪个网址。

Javascript 脚本使用网址中的路径名,判断当前网页位置,从而决定执行哪种操作。

python 代码示例
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""使用 PyQt5 内嵌浏览器浏览网页,并注入 Javascript 脚本实现自动化操作。"""
import os
import sys
from datetime import datetime

from PyQt5.QtWidgets import (
    QWidget, QApplication, QVBoxLayout, QHBoxLayout,
    QDesktopWidget, QTextEdit, QLabel, QLineEdit, QPushButton,
    QFileDialog, QProgressBar,
)
from PyQt5.QtCore import QUrl, pyqtSlot
from PyQt5.QtWebEngineWidgets import QWebEngineView, QWebEngineProfile, QWebEngineScript, QWebEnginePage


class Browser(QWidget):

    def __init__(self):
        super().__init__()
        self.init_ui()

        # 脚本
        self.profile = QWebEngineProfile.defaultProfile()
        self.script = QWebEngineScript()
        self.prepare_script()

    def init_ui(self):
        self.webView = QWebEngineView()

        self.logEdit = QTextEdit()
        self.logEdit.setFixedHeight(100)

        self.addrEdit = QLineEdit()
        self.addrEdit.returnPressed.connect(self.load_url)
        self.webView.urlChanged.connect(
            lambda i: self.addrEdit.setText(i.toDisplayString()))

        self.jsEdit = QLineEdit()
        self.jsEdit.setText("inject.js")

        loadUrlBtn = QPushButton("加载")
        loadUrlBtn.clicked.connect(self.load_url)

        chooseJsBtn = QPushButton("选择脚本文件")
        chooseJsBtn.clicked.connect(self.choose_js_file)

        # 导航/工具
        top = QWidget()
        top.setFixedHeight(80)
        topBox = QVBoxLayout(top)
        topBox.setSpacing(0)
        topBox.setContentsMargins(5, 0, 0, 5)

        progBar = QProgressBar()
        progBox = QHBoxLayout()
        progBox.addWidget(progBar)
        topBox.addLayout(progBox)

        naviBox = QHBoxLayout()
        naviBox.addWidget(QLabel("网址"))
        naviBox.addWidget(self.addrEdit)
        naviBox.addWidget(loadUrlBtn)
        topBox.addLayout(naviBox)

        naviBox = QHBoxLayout()
        naviBox.addWidget(QLabel("注入脚本文件"))
        naviBox.addWidget(self.jsEdit)
        naviBox.addWidget(chooseJsBtn)
        topBox.addLayout(naviBox)

        self.webView.loadProgress.connect(progBar.setValue)

        # 主界面
        layout = QVBoxLayout(self)
        layout.addWidget(self.webView)
        layout.addWidget(top)
        layout.addWidget(self.logEdit)

        self.show()
        self.resize(1024, 900)
        self.center()

    def center(self):
        qr = self.frameGeometry()
        cp = QDesktopWidget().availableGeometry().center()
        qr.moveCenter(cp)
        self.move(qr.topLeft())

    @pyqtSlot()
    def load_url(self):
        url = self.addrEdit.text().strip()
        if not url.lower().startswith("http://") 
                and not url.lower().startswith("https://"):
            url = "http://{}".format(url)
        self.load(url)

    @pyqtSlot()
    def choose_js_file(self):
        f, _ = QFileDialog.getOpenFileName(filter="Javascript files(*.js)")
        if os.path.isfile(f):
            self.jsEdit.setText(f)
            self.prepare_script()

    def prepare_script(self):
        path = self.jsEdit.text().strip()
        if not os.path.isfile(path):
            self.log("invalid js path")
            return

        self.profile.scripts().remove(self.script)
        with open(path, "r") as f:
            self.script.setSourceCode(f.read())
        self.profile.scripts().insert(self.script)
        self.log("injected js ready")

    def log(self, msg, *args, **kwargs):
        m = msg.format(*args, **kwargs)
        self.logEdit.append("{} {}".format(
            datetime.now().strftime("%H:%M:%S"), m))

    def load(self, url):
        self.log(f"loading {url}")
        self.addrEdit.setText(url)
        self.webView.load(QUrl(url))


if __name__ == "__main__":
    app = QApplication(sys.argv)
    b = Browser()
    b.load("http://www.flyscoot.com/")
    sys.exit(app.exec_())
Javascript 脚本示例
// 简单起见,这里只演示部分页面,脚本内容摘自 Heng丶原贴文。
function handle(path) {
    // 首页
    if (path == "/zh") {
        document.getElementsByClassName("radio-inline")[1].click();
        document.getElementById("oneway_from").value="广州 (CAN)";
        document.getElementById("oneway_to").value="新加坡 (SIN)";
        document.getElementById("oneway_departuredate").value="2018年9月10日";
        document.getElementsByClassName("btn--booking")[1].click();
        return;
    }

    // 选择航班
    if (path == "/Book/Flight") {
        document.getElementsByClassName("price--sale")[0].click();
        document.getElementsByClassName("heading-4")[0].click();
        document.getElementsByClassName("btn-submit")[0].click();
        return;
    }

    // 乘客信息
    if (path == "/BookFlight/Passengers") {
        document.getElementsByClassName("fname1")[0].value = "匿名";
    }
}


let host = document.location.hostname;
if (host.endsWith(".flyscoot.com")) {
    handle(document.location.pathname);
}

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/42341.html

相关文章

  • chrome扩展开发之旅 第二篇

    摘要:跨域请求跨域问题,是开发中一直以来需要注意的问题。则发送通道的发送给监听此消息的外部扩展。完整方法此处,为必选参数,为回调函数。回调函数接收到的参数有三个,分别是和,即消息内容,消息发送者相关信息和相应函数。是发起消息的标签。 第二章简介 第二章较第一章复杂许多。书中虽寥寥21页,内容却也不少。涵盖了8个小节。 2.1 操作用户正在浏览的页面 2.2 跨域请求 2.3 常驻后台 2....

    shadajin 评论0 收藏0
  • webpack实战

    摘要:和类似的预处理器还有等。的用处非常多,包括给自动加前缀使用下一代语法等,目前越来越多的人开始用它,它很可能会成为预处理器的最终赢家。 webpack实战 查看所有文档页面:全栈开发,获取更多信息。快马加鞭,加班加点,终于把这个文档整理出来了,顺便深入地学习一番,巩固知识,就是太累人,影响睡眠时间和质量。极客就是想要把事情做到极致,开始了就必须到达终点。 原文链接:webpack实战,原...

    cyrils 评论0 收藏0
  • JavaScript性能优化之加载与执行

    摘要:在浏览区中的性能,可以认为是开发者所面临的最严重的可用性问题。优化这个问题的第一步从它的加载和执行开始。这意味着在对象的事件触发后再下载脚本。属性指明本元素所含的脚本不会修改,因此代码能够安全地执行,但是浏览器的支持情况不理想。 JavaScript在浏览区中的性能,可以认为是开发者所面临的最严重的可用性问题。 优化这个问题的第一步从它的加载和执行开始。 霸道的script标签scr...

    call_me_R 评论0 收藏0
  • 延迟脚本的方式

    摘要:实现延迟加载的方式有方式一标签放在底部将节点放置在之前,这样脚本会在页面显示出来之后再加载。尽可能地合并脚本。采用无阻塞下载脚本的方法使用标签的属性仅适用于和以上版本使用动态创建的元素来下载并执行代码使用对象下载代码并注入页面中。 昨晚‘今日头条’笔试题中遇到这道题,今天专门查了一下。 从 IE 8、Firefox 3.5、Safari 4 和 Chrome 2 开始都允许并行下载 J...

    tinylcy 评论0 收藏0
  • web security

    摘要:是代替用户完成指定的动作,需要知道其他用户页面的代码和数据包。 常见web安全及防护原理 sql注入原理 就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串,最终达到欺骗服务器执行恶意的SQL命令 总的来说有以下几点 永远不要信任用户的输入,要对用户的输入进行校验,可以通过正则表达式,或限制长度,对单引号和双-进行转换等 永远不要使用动态拼装SQL,可以...

    livem 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<