如何在OpenClaw中解决验证码:使用CapSolver扩展的逐步指南

Emma Foster
Machine Learning Engineer
10-Feb-2026

简介
当你的AI助手为你浏览网页时,验证码是最大的障碍。受保护的页面会阻止代理,表单无法提交,任务会因等待人工干预而停滞。
OpenClaw 是一个个人AI助手,可以通过自然语言浏览网页、填写表单、点击按钮并提取数据。但像任何浏览器自动化工具一样,它也会被验证码卡住。
CapSolver 完全改变了这一现状。通过将 CapSolver Chrome 扩展加载到 OpenClaw 的浏览器中,验证码可以在后台自动且不可见地被解决。无需代码。无需从你的侧调用API。无需更改你与AI助手的交流方式。
最棒的是?你甚至不需要向AI提到验证码。 你只需告诉它在提交前等待片刻——当它点击提交时,验证码已经解决了。
什么是OpenClaw?
OpenClaw 是一个你可以在自己的设备上运行的个人AI助手。它通过你已使用的渠道(WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Google Chat、Microsoft Teams 等)与你交流。

关键功能
- 多渠道收件箱:通过 WhatsApp、Discord、Telegram、Slack 等与你的AI交流
- 内置浏览器:代理可以打开标签页、导航页面、点击按钮、填写表单并截屏
- 本地优先:在你自己的硬件上运行——你的数据始终与你在一起
- 插件系统:通过自定义扩展和集成进行扩展
- 语音支持:在 macOS、iOS 和 Android 上与你的代理交谈
浏览器工具
OpenClaw 运行一个专用的 Chromium 浏览器配置文件,只有 AI 代理控制它。它完全与你的个人浏览器隔离。代理可以:
- 打开并导航到任何 URL
- 读取页面内容并截屏
- 点击按钮、填写表单、选择下拉菜单
- 截图并生成 PDF
- 管理多个标签页
可以把它想象成给你的AI助手一个独立的浏览器窗口。
什么是CapSolver?
CapSolver 是一个领先的验证码解决服务,提供AI驱动的解决方案来绕过各种验证码挑战。支持多种验证码类型和快速响应时间,CapSolver 可无缝集成到自动化工作流中。
支持的验证码类型
- reCAPTCHA v2(基于图像和不可见)
- reCAPTCHA v3 & v3 Enterprise
- Cloudflare Turnstile
- Cloudflare 5秒挑战
- AWS WAF 验证码
- 其他广泛使用的验证码和反机器人机制
为什么这个集成与众不同
大多数验证码解决集成需要你编写代码——创建API调用、轮询结果、将令牌注入隐藏表单字段。这就是使用 Crawlee、Puppeteer 或 Playwright 等工具的工作方式。
OpenClaw + CapSolver 从根本上不同:
| 传统(基于代码) | OpenClaw(自然语言) |
|---|---|
编写 CapSolverService 类 |
在配置中启用插件 |
调用 createTask() / getTaskResult() |
只需与你的AI交谈 |
通过 page.$eval() 注入令牌 |
扩展处理一切 |
| 在代码中处理错误、重试、超时 | 告诉AI“等待60秒,然后提交” |
| 每种验证码类型需要不同的代码 | 自动适用于所有类型 |
关键洞察:CapSolver Chrome 扩展在代理的浏览器会话中运行。当代理导航到包含验证码的页面时,扩展会检测到它,在后台解决它,并注入令牌——在代理甚至尝试提交表单之前。
你只需要给它时间。 不需要告诉AI“解决验证码”,你只需说:
“去那个页面,等待60秒,然后点击提交。”
就这样。AI根本不需要知道 CapSolver 的存在。
前提条件
在设置集成之前,请确保你有:
- 安装 OpenClaw 并运行网关
- CapSolver 账户 和 API 密钥(在这里注册)
- 用于测试的 Chromium 或 Chrome(请参阅下面的重要说明)
重要提示:你需要 Chromium,而不是 Google Chrome
Google Chrome 137+(2025年中发布)在品牌构建中静默地移除了
--load-extension支持。 这意味着在标准 Google Chrome 中无法加载 Chrome 扩展。没有任何错误——该标志只是被忽略。
这会影响 Google Chrome 和 Microsoft Edge。你必须使用以下替代方案之一:
| 浏览器 | 扩展加载 | 推荐? |
|---|---|---|
| Google Chrome 137+ | 不支持 | 否 |
| Microsoft Edge | 不支持 | 否 |
| Chrome for Testing | 支持 | 是 |
| Chromium(独立版) | 支持 | 是 |
| Playwright 的捆绑 Chromium | 支持 | 是 |
如何安装 Chrome for Testing:
bash
# 选项1:通过 Playwright(推荐)
npx playwright install chromium
# 二进制文件路径可能为:
# ~/.cache/ms-playwright/chromium-XXXX/chrome-linux64/chrome (Linux)
# ~/Library/Caches/ms-playwright/chromium-XXXX/chrome-mac/Chromium.app/Contents/MacOS/Chromium (macOS)
bash
# 选项2:通过 Chrome for Testing 直接下载
# 访问:https://googlechromelabs.github.io/chrome-for-testing/
# 下载与你的操作系统匹配的版本
安装后,注意二进制文件的完整路径——你将在配置中需要它。
分步设置
步骤1:获取 CapSolver Chrome 扩展
OpenClaw 的 capsolver 插件可以在首次启动时自动下载扩展。或者你可以手动下载:
- 访问 CapSolver 的 Chrome 扩展页面
- 下载扩展包
- 解压到
~/.openclaw/capsolver-extension/
该目录应包含一个 manifest.json 文件(MV3 格式)以及扩展的 JavaScript 文件。
步骤2:启用 CapSolver 插件
编辑你的 OpenClaw 配置文件 ~/.openclaw/openclaw.json:
json
{
"plugins": {
"entries": {
"capsolver": {
"enabled": true,
"config": {
"apiKey": "CAP-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"
}
}
}
}
}
替代方案:作为环境变量设置 API 密钥:
bash
export CAPSOLVER_API_KEY="CAP-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"
步骤3:配置浏览器
在同一个 ~/.openclaw/openclaw.json 文件中,配置浏览器部分:
json
{
"browser": {
"enabled": true,
"executablePath": "/path/to/chrome-for-testing/chrome",
"noSandbox": true,
"defaultProfile": "openclaw"
}
}
替换 /path/to/chrome-for-testing/chrome 为你的 Chrome for Testing 或 Chromium 二进制文件的实际路径。例如:
- Linux(Playwright):
~/.cache/ms-playwright/chromium-1200/chrome-linux64/chrome - macOS(Playwright):
~/Library/Caches/ms-playwright/chromium-1200/chrome-mac/Chromium.app/Contents/MacOS/Chromium
注意:在大多数服务器环境、Docker 容器和 CI 系统中,
noSandbox: true是必需的,因为无法初始化 Chrome sandbox。在具有适当 sandboxing 的桌面系统上,你可以省略此设置。
步骤4:重启网关
bash
# 如果使用 PM2:
pm2 restart opencrawl --update-env
# 如果直接运行:
openclaw gateway restart
步骤5:验证设置
检查网关日志以确认一切正确加载:
bash
pm2 logs opencrawl --lines 20 --nostream
你应该看到这些关键行:
[plugins] capsolver: plugin registered (extension dir: ~/.openclaw/capsolver-extension)
[browser/chrome] Loading 1 extension(s)
[browser/chrome] Spawning Chrome: /path/to/chrome-for-testing (args: 15)
高级检查——通过 Chrome DevTools 协议验证扩展是否激活:
bash
curl -s http://127.0.0.1:8091/json/list
查找 service_worker 条目,其中 URL 包含 chrome-extension://:
json
{
"title": "Service Worker chrome-extension://cnopfoopenkdblckmekkipihdnambjhf/background.js",
"type": "service_worker",
"url": "chrome-extension://cnopfoopenkdblckmekkipihdnambjhf/background.js"
}
如果你看到这个,CapSolver 已加载并正在运行。

如何使用
这是最重要的部分。一旦设置完成,使用 CapSolver 与 OpenClaw 是非常简单的。
黄金法则
不要向AI提及验证码或 CapSolver。 在提交表单前只需给它一点时间。
AI 代理不需要知道验证码。扩展会在后台处理一切。你只需要在指令中包含一个等待时间,这样扩展就有时间在表单提交前解决挑战。
示例1:
将以下内容发送给你的 OpenClaw 代理(通过 Discord、WhatsApp、Telegram 或任何渠道):
去 https://example.com,等待60秒,
然后点击提交并告诉我页面上出现的文本。
幕后发生的事情:
- 代理导航到 reCAPTCHA 演示页面
- CapSolver 的内容脚本检测到 reCAPTCHA 小部件
- 扩展调用 CapSolver API 并解决挑战(通常在10-20秒内)
- 令牌被注入到隐藏的表单字段中
- 60秒后,代理点击提交
- 页面显示:"Verification Success... Hooray!"
示例2:登录受保护的网站
去 https://example.com/login,将电子邮件字段填写为
"[email protected]",将密码填写为 "mypassword123",
然后等待30秒并点击“登录”按钮。
告诉我登录后加载的页面。
示例3:提交 Turnstile 后的表单
打开 https://example.com/contact,填写联系表单:
- 姓名:"John Doe"
- 邮箱:"[email protected]"
- 消息:"你好,我有关于你们服务的问题。"
等待45秒,然后点击“发送消息”。会出现什么确认信息?
推荐的等待时间
| 验证码类型 | 通常解决时间 | 推荐等待 |
|---|---|---|
| reCAPTCHA v2(复选框) | 5-15 秒 | 30-60 秒 |
| reCAPTCHA v2(不可见) | 5-15 秒 | 30 秒 |
| reCAPTCHA v3 | 3-10 秒 | 20-30 秒 |
| Cloudflare Turnstile | 3-10 秒 | 20-30 秒 |
提示:如果不确定,使用60秒。等待更久比过早提交更好。额外的等待时间不会影响结果。
有效自然语言模式
以下是可以使用的经过验证的表达方式:
- "去[URL],等待60秒,然后提交表单"
- "导航到[URL],填写[字段],等待30秒,然后点击[按钮]"
- "打开[URL],大约一分钟后再点击提交并告诉我结果"
- "访问[URL],等待片刻让页面完全加载,然后提交"
不要这样说
避免这些内容——它们可能会让AI困惑或触发拒绝:
"等待验证码被解决"(AI不知道验证码)"使用 CapSolver 解决验证"(AI无法控制扩展)"点击 reCAPTCHA 复选框"(扩展会处理——点击可能干扰)
其工作原理
对于技术爱好者,以下是启用 CapSolver 插件时发生的事情:
你的消息 OpenClaw 网关
───────────────────────────────────────────────────
"去页面, ──► AI 代理收到消息
等待60秒,提交" │
▼
浏览器工具:导航到 URL
│
▼
Chromium 加载页面
┌─────────────────────────────┐
│ 页面带有 reCAPTCHA 小部件 │
│ │
│ CapSolver 扩展: │
│ 1. 内容脚本检测 │
│ reCAPTCHA 在页面上 │
│ 2. 服务工作者调用 │
│ CapSolver API │
│ 3. 收到令牌 │
│ 4. 令牌注入到 │
│ 隐藏表单字段 │
└─────────────────────────────┘
│
▼
AI 代理等待60秒...
│
▼
浏览器工具:点击提交
│
▼
表单提交并带有有效令牌
│
▼
"Verification Success!"
插件架构
CapSolver 插件(extensions/capsolver)在启动时做三件事:
-
下载扩展(如果
autoDownload: true)——从 GitHub 获取官方 CapSolver Chrome 扩展并存储在~/.openclaw/capsolver-extension/ -
配置扩展——将你的 API 密钥、解决模式和验证码类型偏好写入扩展的配置文件
-
注入浏览器配置——将扩展路径添加到 OpenClaw 的浏览器配置中,这样在 Chrome 启动时通过
--load-extension加载 -
注入代理上下文——使用
before_agent_start钩子在 AI 代理中预加载行为指令,告诉它在有验证小部件的页面上提交表单前等待
完整配置参考
这是包含所有 CapSolver 相关选项的完整 ~/.openclaw/openclaw.json 配置:
json
{
"browser": {
"enabled": true,
"executablePath": "/path/to/chrome-for-testing/chrome",
"noSandbox": true,
"defaultProfile": "openclaw"
},
"plugins": {
"entries": {
"capsolver": {
"enabled": true,
"config": {
"apiKey": "CAP-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX",
"autoDownload": true,
"solvingMode": "token"
}
}
}
}
}
配置选项
| 选项 | 默认值 | 描述 |
|---|---|---|
apiKey |
— | 您的CapSolver API密钥(必需,或使用 CAPSOLVER_API_KEY 环境变量) |
autoDownload |
true |
在网关启动时自动下载Chrome扩展程序 |
solvingMode |
"token" |
"token"(注入令牌,支持无头模式)或 "click"(模拟点击) |
故障排除
扩展未加载
症状: 网关日志显示 Loading 1 extension(s) 但CDP中没有 chrome-extension:// 目标出现。
原因: 您使用的是品牌版Google Chrome 137+,它会静默忽略 --load-extension。
解决方法: 切换到Chrome for Testing或Chromium。在您的配置中更新 browser.executablePath 以指向正确的二进制文件。
验证您的Chrome版本:
bash
/path/to/your/chrome --version
# Chrome for Testing: "Chromium 143.0.7499.4"
# 品牌版Chrome: "Google Chrome 143.0.7499.109"
CAPTCHA 未解决(表单失败)
可能原因:
- 等待时间不足 — 增加到60秒
- 无效的API密钥 — 检查您的CapSolver仪表板
- 余额不足 — 为您的CapSolver账户充值
- 扩展未加载 — 参见“扩展未加载”部分
浏览器在首次操作时超时
症状: 网关重启后首次浏览器操作超时,但后续操作正常。
原因: Chromium冷启动 + Playwright CDP连接重试可能在第一次尝试时超过20秒工具超时。
解决方法: 这是一个已知问题。只需重试命令——第二次尝试将成功,因为浏览器现在已启动。
切换浏览器后Chrome崩溃
症状: 从品牌版Chrome切换到Chrome for Testing后,浏览器因磁盘缓存错误崩溃。
原因: 用户数据目录由不同版本的Chrome创建,不兼容。
解决方法: 删除旧的浏览器配置文件并重启:
bash
rm -rf ~/.openclaw/browser/openclaw/user-data
# 然后重启网关
最佳实践
1. 始终使用充足的等待时间
更多等待时间总是更安全。CAPTCHA通常在5-20秒内解决,但网络延迟、复杂挑战或重试可能会增加时间。30-60秒是最佳选择。
2. 保持消息自然
不要使用:
"导航到URL,等待验证码解决,然后提交"
而是使用:
"转到URL,等待大约一分钟,然后提交表单"
自然的表达方式与AI配合更好,避免触发安全拒绝。
3. 监控您的CapSolver余额
每次CAPTCHA解决都会消耗积分。定期检查您的余额以避免中断 capsolver.com/dashboard。
4. 在服务器上使用 noSandbox
在远程服务器、Docker容器或CI环境中运行OpenClaw时,始终在浏览器配置中设置 noSandbox: true。Chrome沙箱需要特殊的内核功能,这在大多数服务器环境中不可用。
5. 在无头服务器上设置 DISPLAY
Chrome扩展程序需要显示,即使在无头服务器上也是如此。使用Xvfb创建虚拟显示:
bash
# 安装Xvfb
sudo apt-get install xvfb
# 启动虚拟显示
Xvfb :99 -screen 0 1280x720x24 &
# 为OpenClaw设置DISPLAY
export DISPLAY=:99
结论
OpenClaw + CapSolver集成代表了一种全新的验证码解决方法。无需编写代码来检测验证码、调用API和注入令牌,您只需:
- 在配置中启用插件
- 指向Chromium(不是品牌版Chrome)
- 自然地与您的AI交流——在表单提交前包括等待时间
CapSolver Chrome扩展程序会处理其余工作——检测验证码,通过CapSolver API解决,并将令牌注入页面。您的AI助手根本不需要知道验证码的存在。
这就是拥有AI助手时的验证码解决方式:隐形、自动且零代码。
准备开始了吗? 注册CapSolver 并使用优惠码 OPENCLAW 在首次充值时获得额外6%的奖励!
常见问题
我需要告诉AI关于CapSolver吗?
不需要。 实际上,您应避免在消息中提及验证码或CapSolver。扩展程序在后台 invisibly 工作。只需在指令中包括等待时间(例如,“等待60秒,然后提交”)以给扩展程序时间解决页面上的任何验证码。
为什么不能使用常规的Google Chrome?
Google Chrome 137+(2025年中发布)在品牌版中移除了 --load-extension 命令行标志的支持。这意味着无法在自动化会话中加载Chrome扩展程序。您需要Chrome for Testing或独立的Chromium,它们仍支持此标志。
CapSolver支持哪些验证码类型?
CapSolver支持reCAPTCHA v2(复选框和不可见)、reCAPTCHA v3、Cloudflare Turnstile、AWS WAF验证码等。Chrome扩展程序会自动检测验证码类型并相应解决。
CapSolver的成本是多少?
CapSolver提供基于验证码类型和数量的有竞争力的定价。访问 capsolver.com 查看当前定价。
OpenClaw是免费的吗?
OpenClaw是开源的,可在自己的硬件上免费运行。您需要AI模型提供商的API密钥,以及CapSolver账户和积分用于验证码解决。
应该告诉AI等待多久?
对于大多数验证码,30-60秒足够。实际解决时间通常为5-20秒,但增加额外缓冲以确保可靠性。不确定时,使用60秒。
可以在无头服务器上使用吗?
可以。您需要Xvfb(X虚拟帧缓冲区)来提供显示,因为Chrome扩展程序需要显示上下文。设置 DISPLAY=:99 并在后台运行 Xvfb :99。同时在浏览器配置中设置 noSandbox: true。
合规声明: 本博客提供的信息仅供参考。CapSolver 致力于遵守所有适用的法律和法规。严禁以非法、欺诈或滥用活动使用 CapSolver 网络,任何此类行为将受到调查。我们的验证码解决方案在确保 100% 合规的同时,帮助解决公共数据爬取过程中的验证码难题。我们鼓励负责任地使用我们的服务。如需更多信息,请访问我们的服务条款和隐私政策。
更多

如何在OpenClaw中解决验证码:使用CapSolver扩展的逐步指南
在OpenClaw中无需编写代码即可通过加载CapSolver Chrome扩展解决CAPTCHAs。自动解决reCAPTCHA、Turnstile等更多类型。

Emma Foster
10-Feb-2026

CapSolver人工智能 CapSolver人工智能-大语言模型架构在实践中的应用:构建自适应CAPTCHA识别系统的决策流水线
探索CapSolver的人工智能大语言模型架构,用于自适应验证码破解,结合视觉、推理和自主决策。

Emma Foster
10-Feb-2026

代理AI新闻:为什么网页自动化在CAPTCHA上持续失败
了解AI代理为何难以应对网页自动化和CAPTCHA。了解如何通过CapSolver的解决方案弥合人工智能推理与执行之间的差距。

Nikolai Smirnov
05-Feb-2026

Crawl4AI 与 Firecrawl:2026年全面对比与评测
比较Crawl4AI与Firecrawl在2026年的表现。了解这些AI网络爬虫工具的功能、价格和性能,用于适用于大语言模型的Markdown提取。

Ethan Collins
04-Feb-2026

浏览器使用与Browserbase:哪种浏览器自动化工具更适合AI代理?
比较Browser Use与Browserbase在AI代理自动化中的应用。了解功能、价格以及如何通过CapSolver解决CAPTCHAs以实现无缝工作流程。

Aloísio Vítor
27-Jan-2026

2026年最顶尖的9个AI代理框架
探索2026年的顶级9个AI代理框架,包括CrewAI、AutoGen和LangGraph。学习如何为多智能体编排和自主代理开发选择最佳框架,并发现用于现实世界网络交互的关键工具。

Lucas Mitchell
26-Jan-2026


