百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

点击鼠标,轻松驾驭网页:Python Selenium 自动化入门指南

wptr33 2024-12-03 03:57 15 浏览

Python 的 Selenium 库是一个强大的工具,可以用来实现自动化网页操作。以下是入门到应用的完整教程,包含常用功能和代码示例。


1. 安装 Selenium

运行以下命令安装 Selenium:

pip install selenium


2. 下载 WebDriver

Selenium 需要与浏览器的 WebDriver 配合使用。以下是常用浏览器的驱动下载地址:

  • Chrome: ChromeDriver
  • Edge: EdgeDriver
  • Firefox: Geckodriver

将下载的驱动程序放在系统 PATH 或项目文件夹中。


3. 基本用法

启动浏览器并打开网页

from selenium import webdriver

from selenium.webdriver.common.by import By



# 启动浏览器

driver = webdriver.Chrome() # 确保 chromedriver PATH

driver.get("https://www.google.com") # 打开目标网页



# 打印网页标题

print("网页标题:", driver.title)



# 关闭浏览器

driver.quit()


4. 常用操作

定位元素

Selenium 支持多种方式定位页面元素:

  • By.ID: 使用元素的 id
  • By.NAME: 使用 name
  • By.XPATH: 使用 XPath 表达式
  • By.CSS_SELECTOR: 使用 CSS 选择器

示例:

# 输入框操作示例

search_box = driver.find_element(By.NAME, "q") # Google 搜索框

search_box.send_keys("Python Selenium") # 输入搜索内容

search_box.submit() # 提交表单

点击按钮

# 定位并点击按钮

button = driver.find_element(By.XPATH, "//button[@type='submit']")

button.click()

获取文本内容

# 获取指定元素的文本内容

element = driver.find_element(By.CLASS_NAME, "example-class")

print("元素文本内容:", element.text)

处理下拉菜单

from selenium.webdriver.support.ui import Select



# 定位下拉菜单并选择选项

dropdown = Select(driver.find_element(By.ID, "dropdown-id"))

dropdown.select_by_visible_text("Option 1") # 根据可见文本选择

dropdown.select_by_value("1") # 根据值选择


5. 高级操作

等待元素加载

使用 WebDriverWait 显式等待元素加载,避免脚本因加载延迟而失败。

from selenium.webdriver.common.by import By

from selenium.webdriver.support.ui import WebDriverWait

from selenium.webdriver.support import expected_conditions as EC



# 显式等待,直到元素可点击

element = WebDriverWait(driver, 10).until(

EC.element_to_be_clickable((By.ID, "clickable-element-id"))

)

element.click()

处理弹窗

# 切换到弹窗并操作

alert = driver.switch_to.alert

print("弹窗内容:", alert.text)

alert.accept() # 点击“确定”

# alert.dismiss() # 点击“取消”

处理 iframe

# 切换到 iframe

driver.switch_to.frame("iframe-id")



# 退出 iframe

driver.switch_to.default_content()


6. 实用脚本:自动登录

以下是一个自动登录网站的示例:

from selenium import webdriver

from selenium.webdriver.common.by import By

from selenium.webdriver.common.keys import Keys



# 初始化浏览器

driver = webdriver.Chrome()

driver.get("https://example.com/login")



# 输入用户名和密码

driver.find_element(By.ID, "username").send_keys("your_username")

driver.find_element(By.ID, "password").send_keys("your_password")



# 提交登录表单

driver.find_element(By.ID, "login-button").click()



# 检查登录是否成功

try:

success_message = driver.find_element(By.ID, "welcome-message").text

print("登录成功:", success_message)

except:

print("登录失败!")



# 关闭浏览器

driver.quit()


7. 常见问题与注意事项

  • 浏览器与驱动版本需匹配: 确保浏览器版本与 WebDriver 对应,通常可以在浏览器“关于”页面查看版本号。

  • 页面动态加载: 动态加载的元素可能需要显式等待(WebDriverWait)或滚动页面以触发加载。

  • 无头浏览器模式: 如果不需要打开浏览器窗口,可使用无头模式运行:

from selenium.webdriver.chrome.options import Options



options = Options()

options.add_argument("--headless") # 开启无头模式

driver = webdriver.Chrome(options=options)





相关推荐

每天一个编程技巧!掌握这7个神技,代码效率飙升200%

“同事6点下班,你却为改BUG加班到凌晨?不是你不努力,而是没掌握‘偷懒’的艺术!本文揭秘谷歌工程师私藏的7个编程神技,每天1分钟,让你的代码从‘能用’变‘逆天’。文末附《Python高效代码模板》,...

Git重置到某个历史节点(Sourcetree工具)

前言Sourcetree回滚提交和重置当前分支到此次提交的区别?回滚提交是指将改动的代码提交到本地仓库,但未推送到远端仓库的时候。...

git工作区、暂存区、本地仓库、远程仓库的区别和联系

很多程序员天天写代码,提交代码,拉取代码,对git操作非常熟练,但是对git的原理并不甚了解,借助豆包AI,写个文章总结一下。Git的四个核心区域(工作区、暂存区、本地仓库、远程仓库)是版本控制的核...

解锁人生新剧本的密钥:学会让往事退场

开篇:敦煌莫高窟的千年启示在莫高窟321窟的《降魔变》壁画前,讲解员指着斑驳色彩说:"画师刻意保留了历代修补痕迹,因为真正的传承不是定格,而是流动。"就像我们的人生剧本,精彩章节永远...

Reset local repository branch to be just like remote repository HEAD

技术背景在使用Git进行版本控制时,有时会遇到本地分支与远程分支不一致的情况。可能是因为误操作、多人协作时远程分支被更新等原因。这时就需要将本地分支重置为与远程分支的...

Git恢复至之前版本(git恢复到pull之前的版本)

让程序回到提交前的样子:两种解决方法:回退(reset)、反做(revert)方法一:gitreset...

如何将文件重置或回退到特定版本(怎么让文件回到初始状态)

技术背景在使用Git进行版本控制时,经常会遇到需要将文件回退到特定版本的情况。可能是因为当前版本出现了错误,或者想要恢复到之前某个稳定的版本。Git提供了多种方式来实现这一需求。...

git如何正确回滚代码(git命令回滚代码)

方法一,删除远程分支再提交①首先两步保证当前工作区是干净的,并且和远程分支代码一致$gitcocurrentBranch$gitpullorigincurrentBranch$gi...

[git]撤销的相关命令:reset、revert、checkout

基本概念如果不清晰上面的四个概念,请查看廖老师的git教程这里我多说几句:最开始我使用git的时候,我并不明白我为什么写完代码要用git的一些列指令把我的修改存起来。后来用多了,也就明白了为什么。gi...

利用shell脚本将Mysql错误日志保存到数据库中

说明:利用shell脚本将MYSQL的错误日志提取并保存到数据库中步骤:1)创建数据库,创建表CreatedatabaseMysqlCenter;UseMysqlCenter;CREATET...

MySQL 9.3 引入增强的JavaScript支持

MySQL,这一广泛采用的开源关系型数据库管理系统(RDBMS),发布了其9.x系列的第三个更新版本——9.3版,带来了多项新功能。...

python 连接 mysql 数据库(python连接MySQL数据库案例)

用PyMySQL包来连接Python和MySQL。在使用前需要先通过pip来安装PyMySQL包:在windows系统中打开cmd,输入pipinstallPyMySQL ...

mysql导入导出命令(mysql 导入命令)

mysql导入导出命令mysqldump命令的输入是在bin目录下.1.导出整个数据库  mysqldump-u用户名-p数据库名>导出的文件名  mysqldump-uw...

MySQL-SQL介绍(mysql sqlyog)

介绍结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统,可以使用相同...

MySQL 误删除数据恢复全攻略:基于 Binlog 的实战指南

在MySQL的世界里,二进制日志(Binlog)就是我们的"时光机"。它默默记录着数据库的每一个重要变更,就像一位忠实的史官,为我们在数据灾难中提供最后的救命稻草。本文将带您深入掌握如...