当前位置：首页 > article >正文

Selenium UI 自动化

article 2025/1/13 23:03:34

一、Selenium 自动化

1、什么是Selenium？

Selenium是web应用中基于UI的自动化测试框架。

2、Selenium的特点？

支持多平台、多浏览器、多语言。

3、自动化工作原理？

在这里插入图片描述
通过上图，我们可以注意到3个角色，下面具体讲解一下：

自动化脚本：对于java来说也就是使用WebDriver API编写的测试脚本。用于发送给浏览器驱动。
浏览器的驱动（browser driver）：每个浏览器都有自己的驱动，均以exe文件形式存在。比如谷歌的chromedriver.exe、火狐的geckodriver.exe、IE的IEDriverServer.exe。它来解析这些自动化测试的代码，解析后把它们发送给浏览器。
浏览器：浏览器当然就是我们很熟悉的常用的各种浏览器。执行浏览器驱动发来的指令，并最终完成工程师想要的操作。

结合上图，我们可以进一步理解：

对于每一条Selenium脚本，一个http请求会被创建并且发送给浏览器的驱动。
浏览器驱动中包含了一个HTTP Server，用来接收这些http请求。
HTTP Server接收到请求后根据请求来具体操控对应的浏览器。
浏览器执行具体的测试步骤。
浏览器将步骤执行结果返回给HTTP Server。
HTTP Server又将结果返回给Selenium的脚本，如果是错误的http代码我们就会在控制台看到对应的报错信息。

二、配置Selenium自动测试环境(Java)

Chrome浏览器。下载地址：https://www.google.cn/intl/zh-CN/chrome/
Chrome的驱动（ChromeDriver）。注意驱动版本要和你的Chrome浏览器版本对应起来。下载地址：https://chromedriver.chromium.org/downloads
Selenium3工具包。maven仓库导入依赖：https://mvnrepository.com/artifact/org.seleniumhq.selenium/selenium-java/3.141.59

编写第一个Selenium的Demo：

    public static void main(String[] args) throws InterruptedException {
        // 创建浏览器驱动
        WebDriver webDriver = new ChromeDriver();
        // 访问百度
        webDriver.get("https://www.baidu.com");
    }

三、常用 WebDriver API 学习

1、元素定位

元素的定位应该是自动化测试的核心，要想操作一个对象，首先应该识别这个对象，webdriver 提供 findElement()、findElements()两种方法搭配对象定位方法进行元素定位。webdriver 提供了一系列的对象定位方法：id、name、class name、link text、partial link text、tag name、xpath、css selector，我们实际测试中比较常用的主要有两种：

（1）css定位：css selector

css定位是基于css选择器的，我们可以通过查找页面中的选择器定位页面元素内容。比如常见的有id选择器：#id、类选择器：.class、标签选择器：标签名、后代选择器：父标签子标签。

（2）xpath定位：xpath

XPath 是一种在XML 文档中定位元素的语言。功能比较强大，但是语法比较复杂，如果想要系统学习，推荐网站 W3school，这里大致介绍一下它的基本使用：

使用绝对路径定位元素：/html/head/title 整个表达式的含义是从文档的根元素开始，选择其子元素 html，再选择子元素 head，最后选择 head 元素下的子元素 title

相对路径+索引：//form/span[1]/input 这个表达式表示从根节点开始，找到所有名为“form”的元素，然后在每个form元素中找到第一个span元素，并在该span元素下找到input元素。这种方法使用了索引，以确切指定所需元素的位置。

相对路径+属性值：//input[@class="s_ipt"] 此XPath表达式用于选择所有标签名为input且class属性的值为"s_ipt"的元素。@符号用于引用属性，这样就可以根据属性值来定位元素。

相对路径+通配符：//[@="su"] 这个XPath表达式使用通配符*来选择文档中所有包含属性名包含指定字符串“su”的元素。这种方法可以用来定位具有特定属性的元素，而不关心具体是哪种元素。

相对路径+文本匹配：//a[text()="新闻"] 该表达式选择所有标签名为a且文本内容为“新闻”的元素。在括号内使用text()函数来指定需要匹配的文本内容。

（3）css定位和xpath定位哪个更好？

如果主要任务是在Web开发中定义样式和布局，那么CSS选择器会更加适合；而如果需要进行复杂的XML文档处理或需要更精细的节点定位，XPath选择器则更为合适。另外CSS选择器是专门为HTML文档设计的，浏览器在解析和渲染HTML页面时会针对CSS选择器进行高效的优化。

PS：在实际的测试中可以打开开发者工具使用选择页面元素，鼠标右键即可快速得到元素的 css/xpath 的定位。

2、操作测试对象

click() 点击对象
sendKeys() 在对象上模拟按键输入
clear() 清除对象中输入的内容
submit() 对象提交

注：如果点击的元素放在 form 标签中，此时使用 submit 实现的效果和 click 是一样的；如果点击的元素放在非 form 标签中，此时使用 submit 会报错。

public class Main {
    public static void main(String[] args) throws InterruptedException {
        // 创建浏览器驱动
        WebDriver webDriver = new ChromeDriver();
        // 访问百度
        webDriver.get("https://www.baidu.com");
        sleep(1000);
        // 在输入框模拟键盘输入
        webDriver.findElement(By.cssSelector("#kw")).sendKeys("csdn不摸鱼的程序员");
        sleep(1000);
        // 点击"百度一下"
        webDriver.findElement(By.cssSelector("#su")).click();
        sleep(1000);
        // 清除输入框
        webDriver.findElement(By.cssSelector("#kw")).clear();
        sleep(1000);
        // 点击第一条搜索结果
        webDriver.findElement(By.cssSelector("#\\31  > div > div:nth-child(1) > h3 > a")).click();
    }
}

结果展示：

3、添加等待

（1）强制等待

在上述代码中我们已经用到了 sleep()，sleep() 是强制等待，它会根据里面的时间参数进行等待。

（2）隐式等待

public class ImplicitlyWaitExample {
    public static void main(String[] args) {
        WebDriver driver = new ChromeDriver();
        driver.manage().timeouts().implicitlyWait(10, TimeUnit.SECONDS);  // 设置隐式等待时间为10秒
        driver.get("https://www.example.com");

        // 后续操作
        // ...

        driver.quit();
    }
}

在上述示例中，我们使用 driver.manage().timeouts().implicitlyWait(10, TimeUnit.SECONDS) 来设置隐式等待时间为10秒。这样，在查找元素或执行命令时，WebDriver会等待一定的时间直到元素出现或超时为止。

注意事项：
driver.manage().timeouts().implicitlyWait(10, TimeUnit.SECONDS) 被放置在创建ChromeDriver实例之后，但是在执行任何实际的测试步骤之前。这确保了在整个测试过程中都会应用隐式等待设置，以便在查找元素时进行等待。值得注意的是，隐式等待仅需要设置一次，通常在WebDriver实例创建后立即设置即可。在整个测试执行过程中，这个设置会对后续的元素查找操作生效，直到WebDriver实例被关闭或隐式等待设置被清除为止。

（3）显式等待

public class WebDriverWaitExample {
    public static void main(String[] args) {
        WebDriver driver = new ChromeDriver();
        driver.get("https://www.example.com");

        // 使用显式等待等待元素可点击
        WebDriverWait wait = new WebDriverWait(driver, 10);
        WebElement button = wait.until(ExpectedConditions.elementToBeClickable(By.id("myButton")));
        button.click();

        // 后续操作
        // ...

        driver.quit();
    }
}

在上述示例中，我们使用了 WebDriverWait 结合 ExpectedConditions，等待直到特定的条件发生后再继续执行。在这里，我们等待元素可点击后再进行点击操作

4、信息获取

getText() 方法用于获取网页元素显示的文本内容，通常指的是元素内部的可见文本。
getAttribute() 方法用于获取元素的指定属性的值，比如id、name、class等。

    public static void main(String[] args) throws InterruptedException {
        // 创建浏览器驱动
        WebDriver webDriver = new ChromeDriver();
        // 访问百度
        webDriver.get("https://www.baidu.com");
        sleep(1000);
        // 获取百度词条文本
        String text = webDriver.findElement(
                By.cssSelector("#hotsearch-content-wrapper > li:nth-child(1) > a > span.title-content-title")).getText();
        System.out.println("元素内文本："+text);
        sleep(1000);
        // 获取输入框name
        String name = webDriver.findElement(By.cssSelector("#kw")).getAttribute("name");
        System.out.println("元素属性 name："+name);
    }

在这里插入图片描述

getCurrentUrl() 方法用于获取当前浏览器所在页面的 URL 地址。

getTitle() 方法用于获取当前页面的标题，即页面标签（）中的文本内容。

    public static void main(String[] args) throws InterruptedException {
        // 创建浏览器驱动
        WebDriver webDriver = new ChromeDriver();
        // 访问百度
        webDriver.get("https://www.baidu.com");
        sleep(1000);
        // 获取百度url
        String url = webDriver.getCurrentUrl();
        System.out.println("百度 url："+url);
        sleep(1000);
        // 获取百度title
        String title = webDriver.getTitle();
        System.out.println("百度 title："+title);
    }

5、鼠标操作

click() 点击：模拟鼠标左键单击操作，可以用于点击链接、按钮或其他可交互的元素。
doubleClick() 双击：模拟鼠标左键双击操作，可以用于特定的双击交互场景。
contextClick() 右键点击：模拟鼠标右键单击操作，可以触发上下文菜单或其他右键交互效果。
moveToElement() 悬停：将鼠标移动到指定的元素上并悬停，可以用于触发显示悬停菜单或者提示信息。
dragAndDrop() 拖放：模拟鼠标拖动操作，通常用于实现拖放交互效果。

Actions类代表用户交互的动作，它用于构建和执行用户在网页上的鼠标、键盘等操作。

public static void main(String[] args) throws InterruptedException {
        // 创建浏览器驱动
        WebDriver driver = new ChromeDriver();
        // 访问百度
        driver.get("https://www.baidu.com");
        sleep(1000);
        // 获取到百度一下按钮
        WebElement element = driver.findElement(By.cssSelector("#su"));
        // 初始化 action
        Actions actions = new Actions(driver);
        // 点击操作
        actions.click(element).perform();
        sleep(1000);

        // 获取底部元素
        WebElement element1 = driver.findElement(By.cssSelector("#bottom_layer > div > p:nth-child(8)"));
        // 双击操作
        actions.doubleClick(element1).perform();
        sleep(1000);

        // 获取“图片”文字
        WebElement element2 = driver.findElement(By.cssSelector("#s-top-left > a:nth-child(6)"));
        // 右键点击操作
        actions.contextClick(element2).perform();
        sleep(1000);

        // 获取到百度logo
        WebElement element3 = driver.findElement(By.cssSelector("#lg > map > area"));
        // 悬停操作
        actions.moveToElement(element3).perform();
        sleep(1000);

        // 模拟拖放操作(从底部移动到顶部)
        WebElement sourceElement = driver.findElement(By.cssSelector("#bottom_layer > div > p:nth-child(1) > a"));
        WebElement targetElement = driver.findElement(By.cssSelector("#s-top-left > a:nth-child(1)"));
        actions.dragAndDrop(sourceElement, targetElement).perform();
        sleep(1000);

        actions.click().perform();
        sleep(1000);

    }

在这里插入图片描述

PS：在 Selenium 中，perform()方法用于执行之前定义的动作序列。当你使用Actions类构建了一系列的鼠标或键盘操作时，这些操作并不会立即执行，而是将它们放入了一个动作序列中。只有当调用perform()方法时，Selenium才会按照你定义的顺序执行这些操作。这种设计方式的好处在于你可以构建复杂的鼠标和键盘操作序列，然后一次性执行它们。

6、键盘操作

sendKeys(Keys.TAB) // TAB
sendKeys(Keys.ENTER) // 回车
sendKeys(Keys.SPACE) // 空格键
sendKeys(Keys.ESCAPE) // 回退键（Esc）
sendKeys(Keys.CONTROL,“a”) // 全选（Ctrl+A）
sendKeys(Keys.CONTROL,“c”) // 复制（Ctrl+C）
sendKeys(Keys.CONTROL,“x”) // 剪贴（Ctrl+X）
sendKeys(Keys.CONTROL,“v”) // 粘贴（Ctrl+V）

    public static void main(String[] args) throws InterruptedException {
        // 创建浏览器驱动
        WebDriver driver = new ChromeDriver();
        // 访问百度
        driver.get("https://www.baidu.com");
        sleep(2000);
        // 获取到百度搜索框
        WebElement element = driver.findElement(By.cssSelector("#kw"));
        // 输入内容-》输入空格-》输入内容-》输入TAP-》输入内容-》回车键
        element.sendKeys("不摸鱼");
        sleep(1000);
        element.sendKeys(Keys.SPACE);
        sleep(1000);
        element.sendKeys("的");
        sleep(1000);
        element.sendKeys(Keys.TAB);
        sleep(1000);
        element.sendKeys("程序员");
        sleep(1000);
        element.sendKeys(Keys.ENTER);

        // 全选-》剪贴-》粘贴
        element.sendKeys(Keys.CONTROL,"a");
        sleep(1000);
        element.sendKeys(Keys.CONTROL,"x");
        sleep(1000);
        element.sendKeys(Keys.CONTROL,"v");
        sleep(1000);
    }

在这里插入图片描述

7、浏览器操作

webDriver.navigate().forward()：这条语句是用于让浏览器向前导航，即转到浏览历史中的下一个页面。
webDriver.navigate().back()：与forward()相反，该语句用于使浏览器返回到浏览历史中的上一个页面。
webDriver.manage().window().maximize()：这是用来最大化浏览器窗口的操作。
webDriver.manage().window().setSize(new Dimension(width, height))：该语句用于设置浏览器窗口的大小。你可以指定所需的宽度和高度参数，从而调整浏览器窗口的大小，适应不同的测试场景或需求。
window.scrollTo(0, document.body.scrollHeight) Js脚本，实现滚动到页面底部。（第一个参数是水平滚动位置，第二个参数是垂直滚动位置）
window.scrollTo(0, 0) Js脚本，实现滚动到页面顶部。

    public static void main(String[] args) throws InterruptedException {
        // 创建浏览器驱动
        WebDriver driver = new ChromeDriver();
        // 访问百度
        driver.get("https://www.baidu.com");
        sleep(2000);
        // 获取到百度搜索框
        WebElement element = driver.findElement(By.cssSelector("#kw"));
        // 搜索“软件测试”
        element.sendKeys("软件测试");
        sleep(1000);
        element.sendKeys(Keys.ENTER);
        sleep(1000);
        // 返回百度首页
        driver.navigate().back();
        sleep(1000);
        // 返回软件测试搜索页
        driver.navigate().forward();
        sleep(1000);
        // 自定义浏览器窗口
        driver.manage().window().setSize(new Dimension(500,500));
        sleep(1000);
        // 实现浏览器窗口最大化
        driver.manage().window().maximize();
        sleep(1000);
        // 实现滚动到页面底部
        JavascriptExecutor js = (JavascriptExecutor) driver;
        js.executeScript("window.scrollTo(0, document.body.scrollHeight)");
        sleep(1000);
        // 实现滚动到页面顶部
        js.executeScript("window.scrollTo(0, 0)");
        sleep(1000);
    }

8、弹窗操作

Alert弹窗、确认框（Confirm）、提示框（Prompt）：

switchTo().alert()：用于切换到页面上的警告框，并返回一个Alert对象，你可以使用这个对象来接受、取消或者输入文本到警告框中。
alert.accept()：用于接受警告框（点击“确定”按钮）。
alert.dismiss()：用于取消警告框（点击“取消”按钮）。
alert.sendKeys("your_text")：用于在警告框中输入文本。

下面就以Prompt提示框为例进行演示：

    public static void main(String[] args) throws InterruptedException {
        // 创建浏览器驱动
        WebDriver webDriver = new ChromeDriver();
        // 访问
        webDriver.get("http://localhost:63342/autoTest/src/main/page/alert.html?_ijt=g52rrlh3gfrag8ivs5g3ec40c0");
        sleep(1500);
        // 点击弹窗按钮
        webDriver.findElement(By.cssSelector("body > button")).click();
        sleep(1000);
        // 切换到页面上的警告框
        Alert alert = webDriver.switchTo().alert();
        // 点击取消
        alert.dismiss();
        sleep(1000);
        // 再次点击按钮
        webDriver.findElement(By.cssSelector("body > button")).click();
        sleep(1000);
        // 输入“不摸鱼”
        alert = webDriver.switchTo().alert();
        alert.sendKeys("不摸鱼");
        sleep(1000);
        // 点击确定
        alert.accept();
        sleep(1000);
    }

9、选项操作

单选按钮（Radio Button）操作：

通过WebElement对象来处理单选按钮。
click()：单击选择单选按钮。

复选框（Checkbox）操作：

通过WebElement对象来处理复选框。
click()：单击以切换复选框的选中状态。

    public static void main(String[] args) throws InterruptedException {
        // 创建浏览器驱动
        WebDriver webDriver = new ChromeDriver();
        // 访问
        webDriver.get("http://localhost:63342/autoTest/src/main/page/choice.html?_ijt=fc7i1795ada371afdv81v0iqk2");
        sleep(1500);
        // 选择并点击2/3两个复选框
        WebElement box1 = webDriver.findElement(By.cssSelector("#c2"));
        box1.click();
        sleep(1000);
        WebElement box2 = webDriver.findElement(By.cssSelector("#c3"));
        box2.click();
        sleep(1000);
        // 选择第二个单选框
        WebElement choice = webDriver.findElement(By.cssSelector("#r2"));
        choice.click();
        sleep(1000);
    }

在这里插入图片描述

10、下拉框操作

通过Select类来处理下拉框：

selectByVisibleText("visible_text")：根据下拉选项的可见文本进行选择。
selectByValue("value")：根据下拉选项的值进行选择。
selectByIndex(index)：根据下拉选项的索引进行选择(从0开始)。

    public static void main(String[] args) throws InterruptedException {
        // 创建浏览器驱动
        WebDriver webDriver = new ChromeDriver();
        // 访问
        webDriver.get("http://localhost:63342/autoTest/src/main/page/pulldown.html?_ijt=bjk05362bbitst3j1nrntnnrn9");
        sleep(1500);
        // 定位下拉框按钮
        WebElement shippingMethod = webDriver.findElement(By.name("ShippingMethod"));
        sleep(1000);
        // 定义select对象
        Select select = new Select(shippingMethod);
        // 根据索引选择第3个
        select.selectByIndex(2);
        sleep(1000);
        // 根据属性孩子选择value=11.61
        select.selectByValue("11.61");
        sleep(1000);
    }

11、上传文件

WebElement.sendKeys()：这是用于将文件路径发送到 input 元素的方法。你可以找到file input元素，然后调用sendKeys()方法并传递文件的绝对路径作为参数，以便实现文件上传操作。

    public static void main(String[] args) throws InterruptedException, IOException {
        // 创建浏览器驱动
        WebDriver webDriver = new ChromeDriver();
        // 访问
        webDriver.get("http://localhost:63342/autoTest/src/main/page/upload.html?_ijt=bhatof5910d1h8q6675j3jjoa5");
        sleep(1500);
        // 上传图片
        WebElement uploadFile = webDriver.findElement(By.cssSelector("body > input[type=file]"));
        uploadFile.sendKeys("D:\\博客图片\\MyBlog\\java.png");
        sleep(1000);
    }

12、截图

截图操作需要导入Commons-io依赖：https://mvnrepository.com/artifact/commons-io/commons-io/2.11.0

然后调用 TakesScreenshot 接口中的 getScreenshotAs() 方法：

    public static void main(String[] args) throws InterruptedException, IOException {
        // 创建浏览器驱动
        WebDriver webDriver = new ChromeDriver();
        // 访问
        webDriver.get("https://www.baidu.com");
        sleep(1500);
        // 搜索“不摸鱼的程序员”
        webDriver.findElement(By.cssSelector("#kw")).sendKeys("不摸鱼的程序员-csdn");
        webDriver.findElement(By.cssSelector("#su")).click();
        sleep(3000);
        // 截图
        File file = ((TakesScreenshot)webDriver).getScreenshotAs(OutputType.FILE);
        // 将图片保存到硬盘
        FileUtils.copyFile(file, new File("D://20231111.png"));
    }

13、iframe 框架定位

在 web 页面中如果使用到iframe框架，则不能直接对框架内部的元素进行定位，需要先切换到对应的iframe在进行定位操作：

webDriver.switchTo().frame()：这是Selenium中用于切换到指定iframe的主要方法。你可以通过索引、ID、名称或WebElement对象来指定要切换到的iframe。
webDriver.switchTo().parentFrame()：当你需要从iframe返回到其上一级的上下文时，可以使用这个方法。
webDriver.switchTo().defaultContent()：如果你需要从所有嵌套的iframes中返回到最外层的页面上下文，可以使用这个方法。

    public static void main(String[] args) throws InterruptedException, IOException {
        // 创建浏览器驱动
        WebDriver webDriver = new ChromeDriver();
        // 访问
        webDriver.get("http://localhost:63342/autoTest/src/main/page/iframe.html?_ijt=hiqvtbuga50aga3831ql9nu2ph");
        sleep(1500);
        // 切换到 iframe:f1
        webDriver.switchTo().frame("f1");
        // 点击内部的click
        webDriver.findElement(By.cssSelector("body > div > div > a")).click();
        sleep(1000);
    }

14、多窗口定位

在讲解多窗口定位前，我们先了解一下窗口句柄：

窗口句柄是一个在操作系统级别用于标识窗口的唯一标识符。在Selenium中，窗口句柄通常用于标识浏览器窗口或标签页，并且允许我们在多个窗口之间进行切换和操作。当你在浏览器中打开一个新的标签页或窗口时，每个窗口都有自己的唯一句柄。通过获取这些句柄，Selenium可以帮助你跟踪和管理不同的窗口，从而实现在多个窗口之间进行切换、定位元素和执行操作的功能。

Selenium 中提供了如下api用于操作窗口：

获取当前窗口句柄：使用driver.getWindowHandle()方法可以获取当前窗口的句柄。
获取所有窗口句柄：使用driver.getWindowHandles()方法可以获取所有打开窗口的句柄。
切换窗口：使用driver.switchTo().window(windowHandle)方法可以切换到指定的窗口。

    public static void main(String[] args) throws InterruptedException, IOException {
        // 创建浏览器驱动
        WebDriver webDriver = new ChromeDriver();
        // 访问百度(注：此时窗口句柄在百度首页，webDerive的所有操作只能针对首页)
        webDriver.get("https://www.baidu.com");
        sleep(1500);
        // 打开百度图片窗口
        webDriver.findElement(By.cssSelector("#s-top-left > a:nth-child(6)")).click();
        sleep(1000);
        // 先将窗口句柄切换到百度图片窗口
        // 1.获取所有窗口句柄
        Set<String> windowHandles = webDriver.getWindowHandles();
        // 2.找到最后一个句柄即为百度图片窗口句柄
        String imageHHandle = "";
        for (String handle : windowHandles) {
            imageHHandle = handle;
        }
        // 3.切换到百度图片窗口
        webDriver.switchTo().window(imageHHandle);
        // 点击百度图片窗口中的头像标签
        webDriver.findElement(By.cssSelector("#wrapper_head_box > div > div > div > div > div.hotquery > a:nth-child(3)")).click();
        sleep(1000);
    }

15、浏览器关闭操作

webDriver.close() 关闭当前聚焦的浏览器窗口，不会清空会话和缓存。
webDriver.quit() 关闭所有的浏览器窗口，会清空会话和缓存。

    public static void main(String[] args) throws InterruptedException, IOException {
        // 创建浏览器驱动
        WebDriver webDriver = new ChromeDriver();
        // 访问百度(注：此时窗口句柄在百度首页，webDerive的所有操作只能针对首页)
        webDriver.get("https://www.baidu.com");
        String mainHandle = webDriver.getWindowHandle(); // 获取首页句柄
        sleep(1500);
        // 打开百度图片窗口
        webDriver.findElement(By.cssSelector("#s-top-left > a:nth-child(6)")).click();
        sleep(1500);
        // 切换到主页（这个操作只是为了将显示页面切换到首页，句柄还是首页）
        webDriver.switchTo().window(mainHandle);
        sleep(1500);
        // 打开百度贴吧窗口
        webDriver.findElement(By.cssSelector("#s-top-left > a:nth-child(4)")).click();
        sleep(1500);
        // 关闭当前聚焦页面(注：由于此时窗口句柄为百度首页，所以此时close()会关闭首页，而不是百度图片页)
        webDriver.close();
        sleep(1500);
        // 关闭浏览器
        webDriver.quit();
    }