抓取流水线失效
验证码在会话中途打断数据采集,导致数据集不完整并浪费计算资源。


Selenium 集成
将 CapSolver 直接集成到 Selenium WebDriver 工作流中,自动解决 reCAPTCHA、Cloudflare Turnstile、Cloudflare Challenge、AWS WAF 和 OCR 挑战 —— 实现无间断的网页抓取、QA 测试和企业级 RPA 自动化。
# Solve CAPTCHA with one API call
from capsolver import solve
solution = solve({
"type": "ReCaptchaV2TaskProxyLess",
"websiteURL": "https://example.com",
"websiteKey": "6Lf...",
})
token = solution["gRecaptchaResponse"]
driver.execute_script(
'document.getElementById("g-recaptcha-response").value = "' + token + '"'
)
痛点分析
Selenium 广泛用于网页抓取、自动化测试和企业级 RPA。然而,现代网站部署了先进的机器人保护系统 —— reCAPTCHA v2、reCAPTCHA v3、Cloudflare Turnstile 和 AWS WAF —— 能够敏锐地检测出无头或高频环境下的自动化流量。
验证码在会话中途打断数据采集,导致数据集不完整并浪费计算资源。
自动化测试套件无法通过验证码挑战,导致发布流水线被阻塞。
企业自动化流程卡在验证码门槛处,需要人工干预才能继续。
当预发布环境出现验证码挑战时,持续集成流水线会发生崩溃。
兼容性
CapSolver 旨在与 Selenium 自动化架构无缝集成。无论是运行本地自动化脚本还是分布式 Selenium Grid 集群,CapSolver 都能实现大规模的可靠验证码识别。
兼容以下环境:
Python Selenium
Java Selenium
C# Selenium
Remote WebDriver
Selenium Grid
基于 Docker 的执行
无头 Chrome & Firefox
为什么选择 CapSolver
行业领先的验证码识别方案,为您的 Selenium 自动化工作流提供动力。
基于 AI 和深度学习的识别技术,为 Selenium 自动化提供持续稳定的识别性能。
平均响应时间极低,助力 Selenium 抓取、QA 和 RPA 流程接近实时运行。
专有任务队列支持分布式 Selenium worker 产生的大规模并行识别请求。
与主流代理供应商无缝集成,支持自动旋转工作流和无代理识别模式。
高性价比的定价方案,同时支持小型 Selenium 测试套件和大型生产级自动化工作负载。
清晰的 API 文档、代码示例、异步回调和自定义请求控制,助团队快速集成。
针对企业需求构建,包括标准化的支持、合规性对齐和可靠的客户支持。
与 Selenium 自动化中常用的住宅和数据中心代理池协同顺畅。
使用场景
CapSolver 旨在与 Selenium 自动化架构无缝集成。无论是运行本地自动化脚本还是分布式 Selenium Grid 集群,CapSolver 都能实现大规模的可靠验证码识别。
构建大规模 Selenium 抓取流水线,用于电商定价数据、旅游酒店监控、市场数据提取和公共数据聚合。CapSolver 确保即便出现验证码,抓取会话也能继续。
兼容性
CapSolver 处理 Selenium 自动化工作流中遇到的所有主流验证码类型。
支持标准版和企业版部署的 Selenium reCAPTCHA v2 识别器,包括复选框和隐形挑战。
处理基于评分的 reCAPTCHA v3,支持配置最小评分阈值,兼容标准和企业环境。
在自动化抓取环境中解决 Cloudflare Turnstile 和 5s 挑战保护。
解决访问受 AWS 保护的 Web 应用程序时的 AWS WAF 验证码挑战。
针对基于图像的验证码和视觉挑战的光学字符识别。
集成
CapSolver 提供可轻松集成到 Selenium 脚本的 REST API。无需浏览器扩展,无需复杂配置 —— 只需一个简单的 API 调用即可返回有效的验证码 Token。
提交站点参数,通过 REST API 无缝获取有效的验证码 Token。
大多数验证码类型的平均识别时间在 10 秒以内。
支持在分布式 Selenium 节点上处理数千个并发请求。
99.9% 的可用性保证,提供优先支持和专属容量。
# Solve CAPTCHA with one API call
from capsolver import solve
solution = solve({
"type": "ReCaptchaV2TaskProxyLess",
"websiteURL": "https://example.com",
"websiteKey": "6Lf...",
})
token = solution["gRecaptchaResponse"]
driver.execute_script(
'document.getElementById("g-recaptcha-response").value = "' + token + '"'
)
加入数千家企业的行列,使用 CapSolver 实现大规模无间断的 Selenium 自动化。
通过我们的 REST API,几分钟内即可上手。