百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

点击鼠标,轻松驾驭网页:Python Selenium 自动化入门指南

wptr33 2024-12-03 03:57 23 浏览

Python 的 Selenium 库是一个强大的工具,可以用来实现自动化网页操作。以下是入门到应用的完整教程,包含常用功能和代码示例。


1. 安装 Selenium

运行以下命令安装 Selenium:

pip install selenium


2. 下载 WebDriver

Selenium 需要与浏览器的 WebDriver 配合使用。以下是常用浏览器的驱动下载地址:

  • Chrome: ChromeDriver
  • Edge: EdgeDriver
  • Firefox: Geckodriver

将下载的驱动程序放在系统 PATH 或项目文件夹中。


3. 基本用法

启动浏览器并打开网页

from selenium import webdriver

from selenium.webdriver.common.by import By



# 启动浏览器

driver = webdriver.Chrome() # 确保 chromedriver PATH

driver.get("https://www.google.com") # 打开目标网页



# 打印网页标题

print("网页标题:", driver.title)



# 关闭浏览器

driver.quit()


4. 常用操作

定位元素

Selenium 支持多种方式定位页面元素:

  • By.ID: 使用元素的 id
  • By.NAME: 使用 name
  • By.XPATH: 使用 XPath 表达式
  • By.CSS_SELECTOR: 使用 CSS 选择器

示例:

# 输入框操作示例

search_box = driver.find_element(By.NAME, "q") # Google 搜索框

search_box.send_keys("Python Selenium") # 输入搜索内容

search_box.submit() # 提交表单

点击按钮

# 定位并点击按钮

button = driver.find_element(By.XPATH, "//button[@type='submit']")

button.click()

获取文本内容

# 获取指定元素的文本内容

element = driver.find_element(By.CLASS_NAME, "example-class")

print("元素文本内容:", element.text)

处理下拉菜单

from selenium.webdriver.support.ui import Select



# 定位下拉菜单并选择选项

dropdown = Select(driver.find_element(By.ID, "dropdown-id"))

dropdown.select_by_visible_text("Option 1") # 根据可见文本选择

dropdown.select_by_value("1") # 根据值选择


5. 高级操作

等待元素加载

使用 WebDriverWait 显式等待元素加载,避免脚本因加载延迟而失败。

from selenium.webdriver.common.by import By

from selenium.webdriver.support.ui import WebDriverWait

from selenium.webdriver.support import expected_conditions as EC



# 显式等待,直到元素可点击

element = WebDriverWait(driver, 10).until(

EC.element_to_be_clickable((By.ID, "clickable-element-id"))

)

element.click()

处理弹窗

# 切换到弹窗并操作

alert = driver.switch_to.alert

print("弹窗内容:", alert.text)

alert.accept() # 点击“确定”

# alert.dismiss() # 点击“取消”

处理 iframe

# 切换到 iframe

driver.switch_to.frame("iframe-id")



# 退出 iframe

driver.switch_to.default_content()


6. 实用脚本:自动登录

以下是一个自动登录网站的示例:

from selenium import webdriver

from selenium.webdriver.common.by import By

from selenium.webdriver.common.keys import Keys



# 初始化浏览器

driver = webdriver.Chrome()

driver.get("https://example.com/login")



# 输入用户名和密码

driver.find_element(By.ID, "username").send_keys("your_username")

driver.find_element(By.ID, "password").send_keys("your_password")



# 提交登录表单

driver.find_element(By.ID, "login-button").click()



# 检查登录是否成功

try:

success_message = driver.find_element(By.ID, "welcome-message").text

print("登录成功:", success_message)

except:

print("登录失败!")



# 关闭浏览器

driver.quit()


7. 常见问题与注意事项

  • 浏览器与驱动版本需匹配: 确保浏览器版本与 WebDriver 对应,通常可以在浏览器“关于”页面查看版本号。

  • 页面动态加载: 动态加载的元素可能需要显式等待(WebDriverWait)或滚动页面以触发加载。

  • 无头浏览器模式: 如果不需要打开浏览器窗口,可使用无头模式运行:

from selenium.webdriver.chrome.options import Options



options = Options()

options.add_argument("--headless") # 开启无头模式

driver = webdriver.Chrome(options=options)





相关推荐

redis的八种使用场景

前言:redis是我们工作开发中,经常要打交道的,下面对redis的使用场景做总结介绍也是对redis举报的功能做梳理。缓存Redis最常见的用途是作为缓存,用于加速应用程序的响应速度。...

基于Redis的3种分布式ID生成策略

在分布式系统设计中,全局唯一ID是一个基础而关键的组件。随着业务规模扩大和系统架构向微服务演进,传统的单机自增ID已无法满足需求。高并发、高可用的分布式ID生成方案成为构建可靠分布式系统的必要条件。R...

基于OpenWrt系统路由器的模式切换与网页设计

摘要:目前商用WiFi路由器已应用到多个领域,商家通过给用户提供一个稳定免费WiFi热点达到吸引客户、提升服务的目标。传统路由器自带的Luci界面提供了工厂模式的Web界面,用户可通过该界面配置路...

这篇文章教你看明白 nginx-ingress 控制器

主机nginx一般nginx做主机反向代理(网关)有以下配置...

如何用redis实现注册中心

一句话总结使用Redis实现注册中心:服务注册...

爱可可老师24小时热门分享(2020.5.10)

No1.看自己以前写的代码是种什么体验?No2.DooM-chip!国外网友SylvainLefebvre自制的无CPU、无操作码、无指令计数器...No3.我认为CS学位可以更好,如...

Apportable:拯救程序员,IOS一秒变安卓

摘要:还在为了跨平台使用cocos2d-x吗,拯救objc程序员的奇葩来了,ApportableSDK:FreeAndroidsupportforcocos2d-iPhone。App...

JAVA实现超买超卖方案汇总,那个最适合你,一篇文章彻底讲透

以下是几种Java实现超买超卖问题的核心解决方案及代码示例,针对高并发场景下的库存扣减问题:方案一:Redis原子操作+Lua脚本(推荐)//使用Redis+Lua保证原子性publicbo...

3月26日更新 快速施法自动施法可独立设置

2016年3月26日DOTA2有一个79.6MB的更新主要是针对自动施法和快速施法的调整本来内容不多不少朋友都有自动施法和快速施法的困扰英文更新日志一些视觉BUG修复就不翻译了主要翻译自动施...

Redis 是如何提供服务的

在刚刚接触Redis的时候,最想要知道的是一个’setnameJhon’命令到达Redis服务器的时候,它是如何返回’OK’的?里面命令处理的流程如何,具体细节怎么样?你一定有问过自己...

lua _G、_VERSION使用

到这里我们已经把lua基础库中的函数介绍完了,除了函数外基础库中还有两个常量,一个是_G,另一个是_VERSION。_G是基础库本身,指向自己,这个变量很有意思,可以无限引用自己,最后得到的还是自己,...

China's top diplomat to chair third China-Pacific Island countries foreign ministers' meeting

BEIJING,May21(Xinhua)--ChineseForeignMinisterWangYi,alsoamemberofthePoliticalBureau...

移动工作交流工具Lua推出Insights数据分析产品

Lua是一个适用于各种职业人士的移动交流平台,它在今天推出了一项叫做Insights的全新功能。Insights是一个数据平台,客户可以在上面实时看到员工之间的交流情况,并分析这些情况对公司发展的影响...

Redis 7新武器:用Redis Stack实现向量搜索的极限压测

当传统关系型数据库还在为向量相似度搜索的性能挣扎时,Redis7的RedisStack...

Nginx/OpenResty详解,Nginx Lua编程,重定向与内部子请求

重定向与内部子请求Nginx的rewrite指令不仅可以在Nginx内部的server、location之间进行跳转,还可以进行外部链接的重定向。通过ngx_lua模块的Lua函数除了能实现Nginx...