百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

Python+Selenium安装及环境配置手把手教会你

wptr33 2024-12-03 03:58 16 浏览

前言

Selenium是一个用于web自动化测试的框架,在使用Ajax请求数据的页面中,会出现 sign ,token等密钥,如果考虑去破解可能花费的精力较多,所以考虑借助使用Selenium框架来实现数据爬取。


Selenium 简介

1. 1,组件?

它提供了以下web自动化测试组件:

  • Selenium IDE,Firefox浏览器的一个插件,提供简单的脚本录制、编辑与回放功能;
  • Selenium Remote Control (RC),是selenium 1 提供的组件,包含:Selenium
  • Server(用于提供自动化测试服务)、Selenium Client(用于执行脚本);
  • Selenium Grid,用于对测试用例集做分布式处理(并行),现已集成到selenium server中;
  • WebDriver,Selenium2(包括Selenium3)抛弃了SeleniumRC,而是使用WebDriver。相比SeleniumRC,Webdriver 的API更容易理解和使用,可读性和可维护性也有较大提高。

因为后面我们的web自动化测试使用的是Selenium3(即WebDriver),这里对WebDriver做一下说明:

  • Webdriver不依赖于任何测试框架,除了必要的浏览器驱动,无需启动其他进程,也不必像Selenium 1那样需要先启动服务;
  • 设计模式:按照Server-Client的经典设计模式设计;
  • Server端:可以是任意的浏览器,当脚本启动浏览器时,该浏览器就是Server,它的职责是处理Client发送的请求并做出响应;
  • Client端:即我们的测试代码,测试代码发送HTTP请求给Server(即浏览器),Server接受请求,执行相应操作并返回结果;

不同的浏览器,WebDriver需要依赖对应的浏览器驱动(如chromedriver.exe)来转化浏览器的native调用,所以进行Selenium自动化时,需先下载对应的浏览器的驱动。


1. 2,特点?

免费开源的自动化测试工具(框架)

  • 支持多平台:windows、linux、MAC
  • 支持多种浏览器:Chrome、Firefox、IE、Safari、Opera
  • 支持多种开发语言: java、ruby、python、C、C#等
  • 支持分布式执行测试用例集,即可并行执行测试


一,Python+Selenium环境搭建

(1)下载python?

建议下载python 3.x版本,官方已经停止对python 2.x版本维护更新。

windows版本官网下载地址:https://www.python.org/downloads/windows/

以安装Python 3.9.12为例,进入上面的网址,根据系统 (32/64位)选择,我这里选择下载64位的


点击进入到下图页面,根据自己的系统选择下载。


(2)安装python?

双击下载好的文件,一路默认安装即可,这里注意勾选添加python至环境变量,这样就不需要后续再设置环境变量了。

先勾选最下方的选项,然后点击Customize installation,注意一定要勾选最下面一个选项,它可以自动帮你添加windows环境变量。点击完成后,进入下一个步骤:

默认全选就好,继续点击下一步:

记得勾选第一项,并选择自己想要安装的路径。然后点击Install后,等几分钟就好了。


(3)验证是否安装完成?

cmd窗口输入命令:python,出现版本信息等则说明安装成功,且环境变量设置成功,如下:



如果在上一步中,未勾选添加python至环境变量,输入python命令后会提示:不是内部或外部命令,只需将python的安装路径添加至环境变量即可,具体添加方法可百度。


(4)安装Selenium?

cmd窗口输入命令:pip install selenium,安装最新版本的selenium

我这安装过了会显示already已经存在了,查看一下selenium版本

安装完成后可以查看版本号,命令为:pip show selenium



二,selenium启动Chrome浏览器

不同的浏览器,需要安装对应浏览器的Selenium驱动才能进行自动化测试。首先介绍Chrome浏览器。

(1)查看Chrome版本信息?

  • 没有安装Chrome浏览器,则需先安装(建议官方地址下载)
  • 官方下载地址为:https://www.google.cn/chrome/
  • 查看Chrome浏览器的版本。首先要查看当前安装的Chrome浏览器的版本,以便下载与浏览器版本对应的驱动文件,打开Chrome浏览器,点击菜单中的“帮助”→“关于Google Chrome”,即可查看Chrome的版本号

这的Chrome版本号为86.0.4240.111。


(2)下载驱动 chromedriver和配置?

下载地址:http://chromedriver.storage.googleapis.com/index.html

也可以选择淘宝镜像下载,地址为:http://npm.taobao.org/mirrors/chromedriver/

低版本Chrome浏览器已经很少使用,就不做对应下载说明了。更新版本的Chrome浏览器(从70~87),只需根据自己电脑上安装的Chrome浏览器版本下载对应的chromedriver即可,如下:


选择好对应的chromedriver点击进入如下:



点击下载,下载完成后,解压该zip文件得到chromedriver.exe文件,将chromedriver.exe放置在python安装目录的Scripts中

点击进入解压生成的文件夹

复制文件放入python安装目录的Scripts文件夹中

注意:需要将解压出来的chromedriver.exe文件放置在Scripts中,而不是将解压得到的chromedriver文件夹放置在Scripts中,否则启动脚本时会报错。

(3)尝试selenium启动Chrome?

尝试启动Chrome浏览器

import time
from selenium import webdriver
driver = webdriver.Chrome() # 启动浏览器
driver.get("https://www.baidu.com") # 打开某个网址
time.sleep(10)
driver.quit() # 关闭浏览器


能打开网址不报错则证明配置完成。


三,selenium启动火狐浏览器(Firefox)

(1)查看火狐浏览器版本?

打开火狐浏览器,点击右上角"菜单"按钮进行查看,步骤如下:

我这里的火狐浏览器版本为:82.0.2 (64 位)



(3)下载驱动 geckodriver?

selenium 3 只支持Firefox 48及以上版本,且需下载驱动,所以配置如下:

Firefox 48 及以上版本,Selenium 3.X + FireFox驱动(geckodriver)

Firefox 47 及以下版本,Selenium 2.X,内置驱动,无需下载

geckodriver下载地址:https://github.com/mozilla/geckodriver/releases

我这里选择目前最新的版本下载(浏览器为64位),如下:



如果按照后续步骤不能启动浏览器,可以尝试删除该版本的geckodriver下载更低的版本的geckodriver。

下载后解压文件,将解压后得到的 geckodriver.exe 文件放置在python安装目录的Scripts中(同chromedriver.exe),如下:

(4)尝试启动火狐浏览器(Firefox)?

import time
from selenium import webdriver
driver = webdriver.Firefox() # 启动浏览器
driver.get("https://www.baidu.com") # 打开某个网址
time.sleep(10)
driver.quit() # 关闭浏览器


启动Firefox浏览器并打开百度网址,如下:


结语

本章说的是关于python的配置及selenium的配置,感谢您的关注与支持!

声明:由于作者也在求学的路上知识水平有限,本文如有错误敬请读者能够指出错误!

相关推荐

每天一个编程技巧!掌握这7个神技,代码效率飙升200%

“同事6点下班,你却为改BUG加班到凌晨?不是你不努力,而是没掌握‘偷懒’的艺术!本文揭秘谷歌工程师私藏的7个编程神技,每天1分钟,让你的代码从‘能用’变‘逆天’。文末附《Python高效代码模板》,...

Git重置到某个历史节点(Sourcetree工具)

前言Sourcetree回滚提交和重置当前分支到此次提交的区别?回滚提交是指将改动的代码提交到本地仓库,但未推送到远端仓库的时候。...

git工作区、暂存区、本地仓库、远程仓库的区别和联系

很多程序员天天写代码,提交代码,拉取代码,对git操作非常熟练,但是对git的原理并不甚了解,借助豆包AI,写个文章总结一下。Git的四个核心区域(工作区、暂存区、本地仓库、远程仓库)是版本控制的核...

解锁人生新剧本的密钥:学会让往事退场

开篇:敦煌莫高窟的千年启示在莫高窟321窟的《降魔变》壁画前,讲解员指着斑驳色彩说:"画师刻意保留了历代修补痕迹,因为真正的传承不是定格,而是流动。"就像我们的人生剧本,精彩章节永远...

Reset local repository branch to be just like remote repository HEAD

技术背景在使用Git进行版本控制时,有时会遇到本地分支与远程分支不一致的情况。可能是因为误操作、多人协作时远程分支被更新等原因。这时就需要将本地分支重置为与远程分支的...

Git恢复至之前版本(git恢复到pull之前的版本)

让程序回到提交前的样子:两种解决方法:回退(reset)、反做(revert)方法一:gitreset...

如何将文件重置或回退到特定版本(怎么让文件回到初始状态)

技术背景在使用Git进行版本控制时,经常会遇到需要将文件回退到特定版本的情况。可能是因为当前版本出现了错误,或者想要恢复到之前某个稳定的版本。Git提供了多种方式来实现这一需求。...

git如何正确回滚代码(git命令回滚代码)

方法一,删除远程分支再提交①首先两步保证当前工作区是干净的,并且和远程分支代码一致$gitcocurrentBranch$gitpullorigincurrentBranch$gi...

[git]撤销的相关命令:reset、revert、checkout

基本概念如果不清晰上面的四个概念,请查看廖老师的git教程这里我多说几句:最开始我使用git的时候,我并不明白我为什么写完代码要用git的一些列指令把我的修改存起来。后来用多了,也就明白了为什么。gi...

利用shell脚本将Mysql错误日志保存到数据库中

说明:利用shell脚本将MYSQL的错误日志提取并保存到数据库中步骤:1)创建数据库,创建表CreatedatabaseMysqlCenter;UseMysqlCenter;CREATET...

MySQL 9.3 引入增强的JavaScript支持

MySQL,这一广泛采用的开源关系型数据库管理系统(RDBMS),发布了其9.x系列的第三个更新版本——9.3版,带来了多项新功能。...

python 连接 mysql 数据库(python连接MySQL数据库案例)

用PyMySQL包来连接Python和MySQL。在使用前需要先通过pip来安装PyMySQL包:在windows系统中打开cmd,输入pipinstallPyMySQL ...

mysql导入导出命令(mysql 导入命令)

mysql导入导出命令mysqldump命令的输入是在bin目录下.1.导出整个数据库  mysqldump-u用户名-p数据库名>导出的文件名  mysqldump-uw...

MySQL-SQL介绍(mysql sqlyog)

介绍结构化查询语言是高级的非过程化编程语言,允许用户在高层数据结构上工作。它不要求用户指定对数据的存放方法,也不需要用户了解具体的数据存放方式,所以具有完全不同底层结构的不同数据库系统,可以使用相同...

MySQL 误删除数据恢复全攻略:基于 Binlog 的实战指南

在MySQL的世界里,二进制日志(Binlog)就是我们的"时光机"。它默默记录着数据库的每一个重要变更,就像一位忠实的史官,为我们在数据灾难中提供最后的救命稻草。本文将带您深入掌握如...