Selenium 集成

用于网页抓取与自动化的 Selenium 验证码解决方案

将 CapSolver 直接集成到 Selenium WebDriver 工作流中,自动解决 reCAPTCHA、Cloudflare Turnstile、Cloudflare Challenge、AWS WAF 和 OCR 挑战 —— 实现无间断的网页抓取、QA 测试和企业级 RPA 自动化。

痛点分析

为什么验证码会阻碍Selenium 自动化

Selenium 广泛用于网页抓取、自动化测试和企业级 RPA。然而,现代网站部署了先进的机器人保护系统 —— reCAPTCHA v2、reCAPTCHA v3、Cloudflare Turnstile 和 AWS WAF —— 能够敏锐地检测出无头或高频环境下的自动化流量。

抓取流水线失效

验证码在会话中途打断数据采集,导致数据集不完整并浪费计算资源。

QA 回归测试中断

自动化测试套件无法通过验证码挑战,导致发布流水线被阻塞。

RPA 工作流停滞

企业自动化流程卡在验证码门槛处,需要人工干预才能继续。

CI/CD 需要人工介入

当预发布环境出现验证码挑战时,持续集成流水线会发生崩溃。

兼容性

专为 Selenium WebDriver 与 Grid 环境设计

CapSolver 旨在与 Selenium 自动化架构无缝集成。无论是运行本地自动化脚本还是分布式 Selenium Grid 集群,CapSolver 都能实现大规模的可靠验证码识别。

兼容以下环境:

Python Selenium

Java Selenium

C# Selenium

Remote WebDriver

Selenium Grid

基于 Docker 的执行

无头 Chrome & Firefox

为什么选择 CapSolver

为什么选择 CapSolver

行业领先的验证码识别方案,为您的 Selenium 自动化工作流提供动力。

高准确率

基于 AI 和深度学习的识别技术,为 Selenium 自动化提供持续稳定的识别性能。

响应迅速

平均响应时间极低,助力 Selenium 抓取、QA 和 RPA 流程接近实时运行。

高并发支持

专有任务队列支持分布式 Selenium worker 产生的大规模并行识别请求。

智能代理管理

与主流代理供应商无缝集成,支持自动旋转工作流和无代理识别模式。

灵活的定价

高性价比的定价方案,同时支持小型 Selenium 测试套件和大型生产级自动化工作负载。

开发者友好

清晰的 API 文档、代码示例、异步回调和自定义请求控制,助团队快速集成。

企业级合规

针对企业需求构建,包括标准化的支持、合规性对齐和可靠的客户支持。

支持代理的抓取配置

与 Selenium 自动化中常用的住宅和数据中心代理池协同顺畅。

使用场景

Selenium 数据与自动化方案

CapSolver 旨在与 Selenium 自动化架构无缝集成。无论是运行本地自动化脚本还是分布式 Selenium Grid 集群,CapSolver 都能实现大规模的可靠验证码识别。

构建大规模 Selenium 抓取流水线,用于电商定价数据、旅游酒店监控、市场数据提取和公共数据聚合。CapSolver 确保即便出现验证码,抓取会话也能继续。

企业级网页抓取
电商定价数据
旅游与酒店监控
市场数据提取
公共数据聚合

兼容性

Selenium 支持的验证码类型

CapSolver 处理 Selenium 自动化工作流中遇到的所有主流验证码类型。

reCAPTCHA v2

支持标准版和企业版部署的 Selenium reCAPTCHA v2 识别器,包括复选框和隐形挑战。

reCAPTCHA v3

处理基于评分的 reCAPTCHA v3,支持配置最小评分阈值,兼容标准和企业环境。

Cloudflare Turnstile & 5s 盾

在自动化抓取环境中解决 Cloudflare Turnstile 和 5s 挑战保护。

AWS WAF

解决访问受 AWS 保护的 Web 应用程序时的 AWS WAF 验证码挑战。

图像转文本 (OCR)

针对基于图像的验证码和视觉挑战的光学字符识别。

集成

简单的 Selenium 集成

CapSolver 提供可轻松集成到 Selenium 脚本的 REST API。无需浏览器扩展,无需复杂配置 —— 只需一个简单的 API 调用即可返回有效的验证码 Token。

查看完整 Selenium API 文档

基于 Token 的解决方案

TOKEN-BASED

提交站点参数,通过 REST API 无缝获取有效的验证码 Token。

极速响应

< 10s

大多数验证码类型的平均识别时间在 10 秒以内。

高并发支持

MAX_THREADS

支持在分布式 Selenium 节点上处理数千个并发请求。

企业级 SLA

99.9%

99.9% 的可用性保证,提供优先支持和专属容量。

integration.py
# Solve CAPTCHA with one API call
from capsolver import solve

solution = solve({
  "type": "ReCaptchaV2TaskProxyLess",
  "websiteURL": "https://example.com",
  "websiteKey": "6Lf...",
})
token = solution["gRecaptchaResponse"]
driver.execute_script(
  'document.getElementById("g-recaptcha-response").value = "' + token + '"'
)

实现 Selenium 自动化告别验证码中断

加入数千家企业的行列,使用 CapSolver 实现大规模无间断的 Selenium 自动化。
通过我们的 REST API,几分钟内即可上手。