
在系统中部署,需遵循以下流程:首先配置pip环境,然后借助pip进行安装,最后确认安装成效。安装环节最为核心,下面将对此环节进行详尽说明。
安装pip时,请先确认已安装此包管理工具。该工具负责软件包的安装与维护。若尚未安装,可依照下列指令进行。
使用管理员权限安装 python3-pip 软件包,需要执行特定命令
安装完pip后,你可以使用以下命令安装:
pip3 install selenium
该命令会自动从 Index (PyPI) 下载并安装库。
一、安装pip
1.1 检查pip是否已安装
安装之前,务必确认系统内是否已安装pip,可通过以下指令进行核实:
pip3 --version
如果pip已经安装,你将会看到类似如下的输出:
pip版本为21.0.1,它位于/usr/local/lib/python3.7/site-packages/pip目录下,该版本是为python 3.7环境安装的
如果未安装pip,可以参考下面的步骤进行安装。
1.2 安装pip
多数Linux系统里,需借助软件集合管理工具来部署pip程序。比如某个特定平台上,可运用这个指令
sudo apt-get update
sudo apt-get install python3-pip
在上方,能够从官方站点获取并部署程序包,pip会自行集成。部署结束后,务必将路径载入系统的环境配置中。
二、使用pip安装
2.1 安装库
确认pip已安装妥当,即可借助它来安装软件包。启动终端程序,或打开命令行窗口,然后键入以下指令:
pip3 install selenium
这个指令会去 Index (PyPI) 下载库,然后进行安装。部署环节大概要持续数分钟,请稍安勿躁。
2.2 验证安装
安装完成后,你可以通过以下命令来验证是否安装成功:
import selenium
print(selenium.__version__)
如果你看到输出的版本号,说明已经成功安装。
三、安装
3.1 下载对应的
必须搭配运用,才能管理浏览器行为。各种浏览器需要借助各自的特定工具。这里列出了主流浏览器的获取路径:
选择适合你浏览器版本的进行下载。
3.2 配置路径
安装完毕后,需把压缩包里的内容放到一个文件夹里,再把那个文件夹的位置告诉电脑系统。要是觉得改系统设置麻烦,也可以在编写程序时直接写好文件的具体地址。比如,操作方法是这样的。
借助selenium包中的webdriver模块,可以启动浏览器进程
驱动程序路径位于路径中到chromedriver的位置
驱动程序实例化Chrome浏览器,其可执行文件路径为指定的驱动路径,通过该路径启动浏览器进程,完成驱动与浏览器的关联,确保后续操作能够被浏览器正确执行。
将/path/to/替换为你实际的路径。
四、编写第一个脚本
4.1 导入库
在开始编写首个脚本时,必须先加载必要的工具包。这里有一个基础范例,它能够访问一个网址,并输出该页面的主要标题。
from selenium import webdriver
使用Chrome浏览器
driver = webdriver.Chrome()
打开一个网页
浏览器访问网址 https://www.example.com, 调用 get 方法, 传入目标链接参数
打印网页标题
print(driver.title)
关闭浏览器
driver.quit()
这个程序会启动浏览器,前往一个特定的网址,接着把页面的主标题显示出来,随后结束浏览器的运行。
4.2 使用不同的浏览器
兼容众多网络浏览器,用户可依据个人需求挑选合适的浏览器种类。此处列举部分常用浏览器的名称,例如。
from selenium import webdriver
driver = webdriver.Firefox()
driver.get("https://www.example.com")
print(driver.title)
driver.quit()
from selenium import webdriver
driver = webdriver.Edge()
driver.get("https://www.example.com")
print(driver.title)
driver.quit()
五、常用操作
5.1 定位元素
有多种途径可以找到网页上的特定部分,比如依据其唯一标识符、分组名称、构成成分、或者内容指针等。接下来,列举几种惯用的查找途径:
element通过driver的find_element_by_id方法获取,其参数为"element_id"
element通过driver的查找功能获取,根据类名"element_class"定位,最终找到对应的元素
element通过driver的调用,利用标签名称定位,获取名为element_tag的元素
element通过driver的find_element_by_link_text方法获取,参数为"element_link_text"
5.2 操作元素
找到目标对象之后,可以对它实施多种动作,诸如进行点击、填入信息、提取特征数据等。接下来列举若干典型动作:
element.click()
element输入文本内容text to input
赋值给attribute_value, 元素获取名为attribute_name的属性值
5.3 等待元素
网页各部分内容呈现快慢不一,所以必须借助明显等待或是暗中等待,等对象完全出现后,才能继续执行步骤。
通过selenium.webdriver.common.by模块可以导入By类
从selenium.webdriver.support.ui包中导入WebDriverW模块AIt
在selenium的驱动支持中,有一个名为expected_conditions的模块,这个模块包含了多种等待条件的功能
element = 等待WebDriver实例十秒,直到条件成立
定位到指定元素,其标识符为element_id,通过ID属性进行查找
)
driver.implicitly_wait(10)
六、处理弹窗和框架
6.1 处理弹窗
使用网页时,有时会碰到弹出窗口,这里有一些方法可以应对这些窗口,比如,这段代码展示了怎样确认一个弹出窗口。
警告框 = 驱动切换至的弹窗
alert.accept()
6.2 切换框架
部分网页会整合其他页面的资料,并设有途径来转换至目标位置。比如,后续代码展示了怎样转向某个页面,并对该页面的物件进行处置。
驱动程序切换到指定框架,框架名称为iframe_name
element = driver.find_element_by_id("element_id")
element.click()
驱动程序切换至初始内容界面,返回到根页面,操作完成。
七、处理多窗口
使用网络页面时,偶尔需要应对好几个浏览器界面。通常的步骤包括:打开新的浏览界面,切换不同的窗口,关闭不需要的标签页,或者整理并排显示的多个窗口。
7.1 获取所有窗口句柄
你可以使用.来获取所有窗口的句柄:
当前窗口句柄已获取,并保存在handles变量中
7.2 切换到指定窗口
你可以使用..来切换到指定的窗口:
驾驶员切换至第二个句柄窗口
7.3 关闭指定窗口
你可以使用.close()来关闭当前窗口:
driver.close()
八、执行代码
有时候,需要在网页上运行特定的指令,这里有实现这一功能的方式。比如,接下来的指令展示了怎样实施一个指令。
执行驱动脚本,弹出提示框,内容为该信息;
你可以借助特定途径来取得网页里的部分信息。比如说,下面这段代码展示了怎样取得页面的主要名称。
标题 = 浏览器获取当前页面标题内容,通过执行指定脚本函数实现,函数返回值即为页面标题文本
print(title)
九、处理文件上传和下载
9.1 文件上传
在网页进行文件上传操作时,可以借助特定技巧来模拟文件选取动作。比如,参考以下代码实例,可以了解上传文件的具体实现过程。
找到名为file_input_id的元素,将其赋值给file_input变量
文件输入部分接收路径信息,具体为路径地址指向文件所在位置
9.2 文件下载
操作文件获取过程较为繁琐,一般要设定网络浏览器的存档位置及获取方式。此处呈现一个通过网络浏览器实现资料获取的示范情形:
from selenium import webdriver
创建一个webdriver.ChromeOptions对象赋值给变量options
prefs = {
设置默认下载目录为路径到下载
"下载提示请求下载"设为否,
设置允许目录升级下载,
"SAFebrowsing.enabled": True
}
选项添加实验性参数配置,使用偏好设置
驱动程序 = web驱动器,使用Chrome,并应用了选项
浏览器访问网址https://www.example.com/download,然后进入下载页面
获取下载链接元素,通过元素ID定位,使用driver完成查找
download_link.click()
十、截取网页截图
实现了截取网页图像的功能。比如,这段代码展示了怎样把网页内容转为图片,并且把结果文件存放到选定的位置:
驾驶员将屏幕截图保存至指定路径,该路径为路径下路径的截图文件名,文件格式为PNG
你可以另取某个特定对象的画面,比如,后面这段指令展示了怎样获取某个对象的画面:
element = driver.find_element_by_id("element_id")
捕捉元素画面,存储路径为路径下的元素截图图片
十一、关闭浏览器
操作全部结束后,请关闭浏览器,这样能够释放系统资源。关闭浏览器的方法有多种,比如
driver.close()
driver.quit()
十二、总结
依照前述指引,你已掌握在系统里部署及运用该软件的方法。文章从安装pip入手,逐项讲解了库的部署、环境的设定、首个程序的编写和基本指令的运用。愿此篇内容对你的学习有所助益,期待你在实践操作中收获丰硕成果!
相关问答FAQs:
如何在 3中安装?
安装 3,可借助包管理工具 pip。命令行输入指定指令,即可顺利完成。
pip install selenium
确认系统已配置好 3及pip软件包。部署完成之后,能够借助脚本里的库引用来核实配置,比如:
from selenium import webdriver
安装时遇到问题该如何解决?
安装过程中若碰到困难,务必检查pip版本是否为最新,可使用指定指令来升级pip,
pip install --upgrade pip
倘若依旧不能安装,请核对您的网络状态,或者尝试借助代理来安装,同时确认未安装多个版本,以免路径产生矛盾。
安装后如何配置浏览器驱动程序?
部署完成后,必须设定浏览器代理程序才能实施程序化检验。各种浏览平台须搭配专属的代理工具,比如此款,又比如那款。获取对应代理后,可将其方位录入系统配置参数,或者直接在程序里标明代理方位,诸如:
驱动程序等于新建的Chrome浏览器实例,其可执行文件路径指向指定位置
这将确保能够找到并使用正确的浏览器驱动。
的主要功能和应用场景是什么?
专门用于网络软件的自动检测。能够模仿使用者与浏览器的互动,比如敲击按键、输入内容、切换界面等。经常用于反复检验、速度评估和自动执行等工作。同时还能执行资料采集,协助人们从不断变化的网页中获取所需资讯。

扫一扫在手机端查看
我们凭借多年的网站建设经验,坚持以“帮助中小企业实现网络营销化”为宗旨,累计为4000多家客户提供品质建站服务,得到了客户的一致好评。如果您有网站建设、网站改版、域名注册、主机空间、手机网站建设、网站备案等方面的需求,请立即点击咨询我们或拨打咨询热线: 13761152229,我们会详细为你一一解答你心中的疑难。


客服1