摘要:一前言上篇文章我们学习了页面操作原理及如何高效的进行元素定位那的工作原理又是什么是如何驱动浏览器的呢这篇文章为你讲解工作原理及对浏览器的配置和操作。基于该运行浏览器所产生的缓存等数据都会被记录。
上篇文章我们学习了Selenium页面操作原理及如何高效的进行元素定位
那Selenium的工作原理又是什么?是如何驱动浏览器的呢?这篇文章为你讲解Selenium工作原理及Webdriver对浏览器的配置和操作。
(PS:个人在用的人工智能学习网站推荐给大家:captainai,觉得不错请三连支持一下)
Selenium进行自动化测试主要依赖三项:
其中核心部分就是Webdriver,它提供了一系列的API来供我们使用,以至于驱动浏览器做一些操作。
它的工作原理有时也会作为面试题,不少小伙伴Selenium用的很熟练,但因为答不出它的工作原理而被Pass!
所以我简单总结了一下,为了面试不被pass的标准答案
Webdriver工作原理:
webdriver用于通信用户编写的代码和浏览器。
当使用类似webdriver.Chrome()
启动浏览器后,webdriver会将启动的浏览器绑定到特定的端口,并作为服务端 (类似前后端分离项目的后端)
客户端 (用户编写的代码),通过ComandExecutor发送HTTP请求给服务端
服务端通过WebService将其翻译为浏览器读的懂的脚本传给浏览器进行执行,执行完成后,浏览器把执行结果返回给WebService,WebService再把返回的结果做一些封装,然后返回给客户端。
通过查看Selnium->webdriver文件夹,发现Selnium支持6种浏览器:
chrome
、edge
、firefox
、ie
、opera
、safari
这里用谷歌、火狐的启动来举例
from selenium import webdriverbrowser = webdriver.Chrome()
from selenium import webdriverbrowser = webdriver.Firefox()
webdriver有很多配置项,例如设置请求头、隐藏浏览器运行、配置Webdriver路径等;下面为你介绍常用的配置项:
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument("--start-maximized")
chrome_options.add_argument("--headless")
chrome_options.add_argument("--no-sandbox")
chrome_options.add_argument("blink-settings=imagesEnabled=false")
以chrome浏览器举例,我们可以通过【cmd】在chrome所在目录执行命令:
chrome.exe --remote-debugging-port=9222 --user-data-dir="C:/selenum/AutomationProfile"
-remote-debugging-port
:用于配置浏览器启动占用的端口,可以指定任何未被占用的端口
-user-data-dir
:指定创建新Chrome配置文件的目录;它是为了确保在多带带的配置文件中启动chrome,不会污染你的默认配置文件。
然后在代码中加入下面的配置即可使用刚刚打开的浏览器了
chrome_options.add_experimental_option("debuggerAddress", "127.0.0.1:9222")
这样做的好处是:
当存在多个谷歌浏览器或谷歌浏览器环境异常时,可以指定其浏览器文件路径进行驱动
chrome_options.binary_location = r"C:/Program Files (x86)/Google/Chrome/Application/chrome.exe"
通过该配置项可以隐藏上图的提示
chrome_options.add_experimental_option("excludeSwitches", ["enable-automation"])
下面的代码会启动一个宽100
,长1000
的浏览器
chrome_options.add_argument(f"--window-size={100},{1000}")
下面的代码会启动一个左边距为100
,上边距为200
的浏览器
chrome_options.add_argument(f"--window-position={100},{200}")
有时候开启浏览器需要特别的语言版本,如果未进行配置则启动的是系统语言对应的浏览器,我们的被测网站如果是英文的,但系统是中文的,开启的浏览器就是中文的,提交的某些数据按照zh_CN.UTF-8
的格式提交了,导致数据报错,那么我们就需要设置浏览器启动语言。
chrome_options.add_argument("lang=en-us")
有时候需要模拟手机访问某些页面的时候,可以通过配置user-agent
项来实现
下面的代码会将浏览器模拟为安卓手机访问
user_ag = "MQQBrowser/26 Mozilla/5.0 (Linux; U; Android 7.3.7; zh-cn; MB200 Build/GRJ22;CyanogenMod-7) " / "AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1 "chrome_options.add_argument("user-agent=%s" % user_agent)
执行效果
chrome_options.add_argument("--proxy-server=你的代理ip地址")
下面的代码会【最大化窗口】且【不加载图片】的启动一个浏览器:
from selenium import webdriverchrome_options = webdriver.ChromeOptions()chrome_options.add_argument("--start-maximized")chrome_options.add_argument("blink-settings=imagesEnabled=false")browser = webdriver.Chrome(options=chrome_options)
browser.name
browser.maximize_window()
browser.minimize_window()
类似浏览器中按下【F11】
browser.fullscreen_window()
browser.get("https://www.baidu.com") #访问百度
browser.current_url
browser.title
browser.current_window_handle
browser.save_screenshot("test.png") #截取当前窗口并命名为`test.png`保存
browser.refresh()
browser.forward()
browser.back()
设置浏览器宽为480
,高为800
browser.set_window_size(480, 800)
设置浏览器宽为480
,高为800
browser.set_window_position(480, 800)
设置浏览器宽为480
,高为800
browser.get_window_size(480, 800)
设置浏览器宽为480
,高为800
browser.get_window_position(480, 800)
如果需要进行页面滑动(模拟鼠标滚轮操作)可以通过执行js
脚本实现
例如滑动到"//*[@id="asideHotArticle"]/h3"
元素:
target = browser.find_element(By.XPATH, "//*[@id="asideHotArticle"]/h3")browser.execute_script("arguments[0].scrollIntoView();", target)
有多个窗口时,可以通过下面的方法进行切换才能够顺利的进行定位
browser.switch_to.window(browser.window_handles[1])
页面中的iframe弹窗,需要使用下面的代码切换才能够顺利的进行定位
iframe = browser.find_element(By.CSS_SELECTOR, "#modal > iframe")# 切换到iframebrowser.switch_to.frame(iframe)
离开iframe,回到默认页面
browser.switch_to.default_content()
有多个页面的时候,只会关闭当前所在页面
browser.close()
会直接关闭浏览器,所有页面都将关闭
browser.quit()
实际上webdriver的操作还有很多,比如远程控制项的配置,cookie相关配置等,但都不常用,掌握这些些已经足够了!
下一篇文章会对selenium的键盘鼠标事件进行详解,欢迎订阅本专栏!
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/122436.html
摘要:一前言本专栏将结合元素定位和前沿的图像识别定位两种方法,从到的构建一个企业级自动化测试框架。 一、前言 本专栏将结合元素定位(selenium/appium)和前沿...
摘要:那是怎样知道我们想要操作哪个元素的呢这篇文章将为你讲解的页面操作原理和高效的元素定位方法。它的含义为匹配名称包含的元素。 一、前言 上篇文章中我们成功编写并启动了第...
摘要:我们将用集成测试来结束我们的测试部分。作为对集成测试的一个提醒它是自动化我们的实际用户在使用我们的应用时体验到的体验的过程。出于我们的目的我们将只使用上面的基本配置因为它已经足够让集成测试继续进行。 本文转载自:众成翻译译者:iOSDevLog链接:http://www.zcfy.cc/article/3808原文:https://www.fullstackreact.com/30-d...
阅读 2916·2023-04-25 19:08
阅读 1414·2021-11-16 11:45
阅读 1964·2021-10-13 09:40
阅读 4123·2021-09-30 09:47
阅读 2413·2019-08-30 15:44
阅读 2258·2019-08-30 13:03
阅读 1384·2019-08-30 12:56
阅读 1888·2019-08-26 14:04