
Ethan Collins
Pattern Recognition Specialist

UI.Vision是一款流行的开源RPA和浏览器自动化扩展程序,适用于Chrome和Firefox。它广泛用于网页抓取、数据提取、自动化测试和表单填写,允许开发者和非程序员直接在浏览器中构建宏或运行Selenium IDE脚本。但是,当处理受CAPTCHA保护的网站时,这些自动化操作通常会中断并需要手动解决。
CapSolver是一款AI驱动的CAPTCHA解决服务,专为大规模抓取、爬取和浏览器自动化而设计。它可以自动解决reCAPTCHA、Cloudflare Turnstile和其他常见的挑战。通过将CapSolver扩展程序与UI.Vision结合使用,您可以轻松创建完全无人工干预的自动化工作流程。
本指南介绍如何快速将CapSolver集成到UI.Vision中,包括设置、可立即使用的宏示例以及可靠网页自动化的最佳实践。
UI.Vision RPA是一款多功能浏览器自动化工具,它将可视化脚本与高级功能(例如通过XModules进行计算机视觉)、API调用和桌面自动化相结合。作为一个扩展程序,它直接在浏览器中运行,支持Chrome、Firefox和Edge,并提供无头模式和命令行执行选项。它可免费无限使用,并提供可选的付费附加组件以增强功能。
UI.Vision适用于各种自动化任务,包括:
CAPTCHA经常出现在这些场景中,尤其是在登录页面或表单上,因此解决集成对于不间断运行至关重要。
网站使用CAPTCHA来阻止自动化机器人,这可能会使UI.Vision宏在执行过程中停止。这些防御措施需要人工验证,从而导致无头或计划自动化失败。
常见的CAPTCHA类型包括:
| CAPTCHA类型 | 说明 |
|---|---|
| reCAPTCHA v2 | 需要用户勾选一个框或根据提示选择图像。![]() |
| reCAPTCHA v3 | 使用评分系统来评估用户行为,通常对用户不可见。 |
| Cloudflare Turnstile | 一种注重隐私的CAPTCHA替代方案,最大限度地减少用户交互。![]() |
CapSolver的浏览器扩展程序会自动检测并解决这些问题,从而允许UI.Vision在继续操作之前等待解决。
CapSolver提供了一个浏览器扩展程序,可以自动解决页面上的CAPTCHA。通过安装扩展程序并在宏中使用wait/assert命令来检测“已解决”状态,将其与UI.Vision集成。
UI.Vision使用基于JSON的宏。以下示例等待CapSolver的“已解决”指示器(id='capsolver-solver-tip-button'和data-state='solved'的元素)。
以下是完整的UI.Vision宏(JSON格式),它演示了使用CapSolver扩展程序在演示页面上解决reCAPTCHA v2。
{
"Name": "solve captcha",
"CreationDate": "2025-8-20",
"Commands": [
{
"Command": "open",
"Target": "https://www.google.com/recaptcha/api2/demo",
"Value": "",
"Description": ""
},
{
"Command": "waitForPageToLoad",
"Target": "",
"Value": "",
"Description": ""
},
{
"Command": "waitForElementPresent",
"Target": "xpath=//*[@id='capsolver-solver-tip-button' and @data-state='solved']",
"Value": "30000",
"Description": ""
},
{
"Command": "assertElementPresent",
"Target": "xpath=//*[@id='capsolver-solver-tip-button' and @data-state='solved']",
"Value": "",
"Description": ""
},
{
"Command": "click",
"Target": "id=recaptcha-demo-submit",
"Value": "",
"Description": ""
}
]
}
| 步骤 | 说明 |
|---|---|
| 1. 打开页面 | 使用open导航到出现CAPTCHA的reCAPTCHA演示站点。 |
| 2. 等待页面加载 | waitForPageToLoad确保页面完全加载后再继续。 |
| 3. 等待CAPTCHA解决 | waitForElementPresent检查CapSolver的已解决指示器(具有data-state='solved'的按钮的XPath),30秒后超时。扩展程序在后台自动解决。 |
| 4. 断言已解决 | assertElementPresent验证CAPTCHA是否已解决;如果未解决,则宏将失败。 |
| 5. 提交表单 | 单击提交按钮以完成操作(一旦解决)。 |
| 6. 运行和监控 | 在UI.Vision中播放宏;扩展程序处理解决,日志显示进度。 |
此宏依赖于CapSolver扩展程序自动注入解决方案。
此宏自动执行reCAPTCHA演示上的CAPTCHA解决:
对于实际使用,如果解决时间较长,请调整超时或添加错误处理(例如循环)。
| 问题 | 答案 |
|---|---|
| CapSolver可以解决哪些类型的CAPTCHA? | CapSolver支持reCAPTCHA v2/v3、Cloudflare Turnstile等等。请参阅CapSolver文档以了解完整列表。 |
| 如何处理不同的CAPTCHA类型? | 扩展程序自动检测类型;在CapSolver设置中配置受支持的类型。如果指示器更改,请更新XPath。 |
| 如果CapSolver无法解决CAPTCHA怎么办? | 在宏中添加重试循环或检查扩展程序日志。增加复杂CAPTCHA的等待时间。 |
| 我可以将CapSolver与其他RPA工具一起使用吗? | 可以,CapSolver的扩展程序可与任何基于浏览器的工具一起使用;API集成可用于基于代码的设置。 |
| 在UI.Vision中使用CapSolver是否需要代理? | 代理有助于解决IP封锁问题;在扩展程序或UI.Vision中进行配置以应对高级场景。 |
将CapSolver浏览器扩展程序与UI.Vision集成可以简化RPA工作流程中的CAPTCHA处理,使宏能够自主运行。这种组合利用了UI.Vision的可视化自动化和CapSolver的AI解决方案,从而实现高效可靠的任务。
要开始使用,请注册CapSolver并安装扩展程序。下载UI.Vision并导入示例宏。有关更多信息,请浏览CapSolver文档和UI.Vision文档。立即自动化您的CAPTCHA!
ui.vision用户额外奖励: 为您的CapSolver帐户充值时,使用促销代码uivision,即可获得独家6%的额外积分——无限制,永不过期。