CAPSOLVER
博客
如何在OpenClaw中解决验证码:使用CapSolver扩展的分步指南

如何在OpenClaw中解决验证码:使用CapSolver扩展的逐步指南

Logo of CapSolver

Emma Foster

Machine Learning Engineer

10-Feb-2026

在OpenClaw中解决验证码

简介

当你的AI助手为你浏览网页时,验证码是最大的障碍。受保护的页面会阻止代理,表单无法提交,任务会因等待人工干预而停滞。

OpenClaw 是一个个人AI助手,可以通过自然语言浏览网页、填写表单、点击按钮并提取数据。但像任何浏览器自动化工具一样,它也会被验证码卡住。

CapSolver 完全改变了这一现状。通过将 CapSolver Chrome 扩展加载到 OpenClaw 的浏览器中,验证码可以在后台自动且不可见地被解决。无需代码。无需从你的侧调用API。无需更改你与AI助手的交流方式。

最棒的是?你甚至不需要向AI提到验证码。 你只需告诉它在提交前等待片刻——当它点击提交时,验证码已经解决了。


什么是OpenClaw?

OpenClaw 是一个你可以在自己的设备上运行的个人AI助手。它通过你已使用的渠道(WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Google Chat、Microsoft Teams 等)与你交流。


关键功能

  • 多渠道收件箱:通过 WhatsApp、Discord、Telegram、Slack 等与你的AI交流
  • 内置浏览器:代理可以打开标签页、导航页面、点击按钮、填写表单并截屏
  • 本地优先:在你自己的硬件上运行——你的数据始终与你在一起
  • 插件系统:通过自定义扩展和集成进行扩展
  • 语音支持:在 macOS、iOS 和 Android 上与你的代理交谈

浏览器工具

OpenClaw 运行一个专用的 Chromium 浏览器配置文件,只有 AI 代理控制它。它完全与你的个人浏览器隔离。代理可以:

  • 打开并导航到任何 URL
  • 读取页面内容并截屏
  • 点击按钮、填写表单、选择下拉菜单
  • 截图并生成 PDF
  • 管理多个标签页

可以把它想象成给你的AI助手一个独立的浏览器窗口。


什么是CapSolver?

CapSolver 是一个领先的验证码解决服务,提供AI驱动的解决方案来绕过各种验证码挑战。支持多种验证码类型和快速响应时间,CapSolver 可无缝集成到自动化工作流中。

支持的验证码类型

为什么这个集成与众不同

大多数验证码解决集成需要你编写代码——创建API调用、轮询结果、将令牌注入隐藏表单字段。这就是使用 Crawlee、Puppeteer 或 Playwright 等工具的工作方式。

OpenClaw + CapSolver 从根本上不同:

传统(基于代码) OpenClaw(自然语言)
编写 CapSolverService 在配置中启用插件
调用 createTask() / getTaskResult() 只需与你的AI交谈
通过 page.$eval() 注入令牌 扩展处理一切
在代码中处理错误、重试、超时 告诉AI“等待60秒,然后提交”
每种验证码类型需要不同的代码 自动适用于所有类型

关键洞察:CapSolver Chrome 扩展在代理的浏览器会话中运行。当代理导航到包含验证码的页面时,扩展会检测到它,在后台解决它,并注入令牌——在代理甚至尝试提交表单之前。

你只需要给它时间。 不需要告诉AI“解决验证码”,你只需说:

“去那个页面,等待60秒,然后点击提交。”

就这样。AI根本不需要知道 CapSolver 的存在。


前提条件

在设置集成之前,请确保你有:

  1. 安装 OpenClaw 并运行网关
  2. CapSolver 账户 和 API 密钥(在这里注册
  3. 用于测试的 Chromium 或 Chrome(请参阅下面的重要说明)

重要提示:你需要 Chromium,而不是 Google Chrome

Google Chrome 137+(2025年中发布)在品牌构建中静默地移除了 --load-extension 支持。 这意味着在标准 Google Chrome 中无法加载 Chrome 扩展。没有任何错误——该标志只是被忽略。

这会影响 Google Chrome 和 Microsoft Edge。你必须使用以下替代方案之一:

浏览器 扩展加载 推荐?
Google Chrome 137+ 不支持
Microsoft Edge 不支持
Chrome for Testing 支持
Chromium(独立版) 支持
Playwright 的捆绑 Chromium 支持

如何安装 Chrome for Testing:

bash 复制代码
# 选项1:通过 Playwright(推荐)
npx playwright install chromium

# 二进制文件路径可能为:
# ~/.cache/ms-playwright/chromium-XXXX/chrome-linux64/chrome  (Linux)
# ~/Library/Caches/ms-playwright/chromium-XXXX/chrome-mac/Chromium.app/Contents/MacOS/Chromium  (macOS)
bash 复制代码
# 选项2:通过 Chrome for Testing 直接下载
# 访问:https://googlechromelabs.github.io/chrome-for-testing/
# 下载与你的操作系统匹配的版本

安装后,注意二进制文件的完整路径——你将在配置中需要它。


分步设置

步骤1:获取 CapSolver Chrome 扩展

OpenClaw 的 capsolver 插件可以在首次启动时自动下载扩展。或者你可以手动下载:

  1. 访问 CapSolver 的 Chrome 扩展页面
  2. 下载扩展包
  3. 解压到 ~/.openclaw/capsolver-extension/

该目录应包含一个 manifest.json 文件(MV3 格式)以及扩展的 JavaScript 文件。

步骤2:启用 CapSolver 插件

编辑你的 OpenClaw 配置文件 ~/.openclaw/openclaw.json

json 复制代码
{
  "plugins": {
    "entries": {
      "capsolver": {
        "enabled": true,
        "config": {
          "apiKey": "CAP-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"
        }
      }
    }
  }
}

替代方案:作为环境变量设置 API 密钥:

bash 复制代码
export CAPSOLVER_API_KEY="CAP-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX"

步骤3:配置浏览器

在同一个 ~/.openclaw/openclaw.json 文件中,配置浏览器部分:

json 复制代码
{
  "browser": {
    "enabled": true,
    "executablePath": "/path/to/chrome-for-testing/chrome",
    "noSandbox": true,
    "defaultProfile": "openclaw"
  }
}

替换 /path/to/chrome-for-testing/chrome 为你的 Chrome for Testing 或 Chromium 二进制文件的实际路径。例如:

  • Linux(Playwright)~/.cache/ms-playwright/chromium-1200/chrome-linux64/chrome
  • macOS(Playwright)~/Library/Caches/ms-playwright/chromium-1200/chrome-mac/Chromium.app/Contents/MacOS/Chromium

注意:在大多数服务器环境、Docker 容器和 CI 系统中,noSandbox: true 是必需的,因为无法初始化 Chrome sandbox。在具有适当 sandboxing 的桌面系统上,你可以省略此设置。

步骤4:重启网关

bash 复制代码
# 如果使用 PM2:
pm2 restart opencrawl --update-env

# 如果直接运行:
openclaw gateway restart

步骤5:验证设置

检查网关日志以确认一切正确加载:

bash 复制代码
pm2 logs opencrawl --lines 20 --nostream

你应该看到这些关键行:

复制代码
[plugins] capsolver: plugin registered (extension dir: ~/.openclaw/capsolver-extension)
[browser/chrome] Loading 1 extension(s)
[browser/chrome] Spawning Chrome: /path/to/chrome-for-testing (args: 15)

高级检查——通过 Chrome DevTools 协议验证扩展是否激活:

bash 复制代码
curl -s http://127.0.0.1:8091/json/list

查找 service_worker 条目,其中 URL 包含 chrome-extension://

json 复制代码
{
  "title": "Service Worker chrome-extension://cnopfoopenkdblckmekkipihdnambjhf/background.js",
  "type": "service_worker",
  "url": "chrome-extension://cnopfoopenkdblckmekkipihdnambjhf/background.js"
}

如果你看到这个,CapSolver 已加载并正在运行。

如何使用

这是最重要的部分。一旦设置完成,使用 CapSolver 与 OpenClaw 是非常简单的

黄金法则

不要向AI提及验证码或 CapSolver。 在提交表单前只需给它一点时间。

AI 代理不需要知道验证码。扩展会在后台处理一切。你只需要在指令中包含一个等待时间,这样扩展就有时间在表单提交前解决挑战。

示例1:

将以下内容发送给你的 OpenClaw 代理(通过 Discord、WhatsApp、Telegram 或任何渠道):

复制代码
去 https://example.com,等待60秒,
然后点击提交并告诉我页面上出现的文本。

幕后发生的事情:

  1. 代理导航到 reCAPTCHA 演示页面
  2. CapSolver 的内容脚本检测到 reCAPTCHA 小部件
  3. 扩展调用 CapSolver API 并解决挑战(通常在10-20秒内)
  4. 令牌被注入到隐藏的表单字段中
  5. 60秒后,代理点击提交
  6. 页面显示:"Verification Success... Hooray!"

示例2:登录受保护的网站

复制代码
去 https://example.com/login,将电子邮件字段填写为
"[email protected]",将密码填写为 "mypassword123",
然后等待30秒并点击“登录”按钮。
告诉我登录后加载的页面。

示例3:提交 Turnstile 后的表单

复制代码
打开 https://example.com/contact,填写联系表单:
- 姓名:"John Doe"
- 邮箱:"[email protected]"
- 消息:"你好,我有关于你们服务的问题。"
等待45秒,然后点击“发送消息”。会出现什么确认信息?

推荐的等待时间

验证码类型 通常解决时间 推荐等待
reCAPTCHA v2(复选框) 5-15 秒 30-60 秒
reCAPTCHA v2(不可见) 5-15 秒 30 秒
reCAPTCHA v3 3-10 秒 20-30 秒
Cloudflare Turnstile 3-10 秒 20-30 秒

提示:如果不确定,使用60秒。等待更久比过早提交更好。额外的等待时间不会影响结果。

有效自然语言模式

以下是可以使用的经过验证的表达方式:

  • "去[URL],等待60秒,然后提交表单"
  • "导航到[URL],填写[字段],等待30秒,然后点击[按钮]"
  • "打开[URL],大约一分钟后再点击提交并告诉我结果"
  • "访问[URL],等待片刻让页面完全加载,然后提交"

不要这样说

避免这些内容——它们可能会让AI困惑或触发拒绝:

  • "等待验证码被解决"(AI不知道验证码)
  • "使用 CapSolver 解决验证"(AI无法控制扩展)
  • "点击 reCAPTCHA 复选框"(扩展会处理——点击可能干扰)

其工作原理

对于技术爱好者,以下是启用 CapSolver 插件时发生的事情:

复制代码
  你的消息                    OpenClaw 网关
  ───────────────────────────────────────────────────
  "去页面,          ──►  AI 代理收到消息
   等待60秒,提交"         │
                              ▼
                         浏览器工具:导航到 URL
                              │
                              ▼
                         Chromium 加载页面
                         ┌─────────────────────────────┐
                         │  页面带有 reCAPTCHA 小部件  │
                         │                              │
                         │  CapSolver 扩展:        │
                         │  1. 内容脚本检测   │
                         │     reCAPTCHA 在页面上    │
                         │  2. 服务工作者调用     │
                         │     CapSolver API            │
                         │  3. 收到令牌           │
                         │  4. 令牌注入到      │
                         │     隐藏表单字段        │
                         └─────────────────────────────┘
                              │
                              ▼
                         AI 代理等待60秒...
                              │
                              ▼
                         浏览器工具:点击提交
                              │
                              ▼
                         表单提交并带有有效令牌
                              │
                              ▼
                         "Verification Success!"

插件架构

CapSolver 插件(extensions/capsolver)在启动时做三件事:

  1. 下载扩展(如果 autoDownload: true)——从 GitHub 获取官方 CapSolver Chrome 扩展并存储在 ~/.openclaw/capsolver-extension/

  2. 配置扩展——将你的 API 密钥、解决模式和验证码类型偏好写入扩展的配置文件

  3. 注入浏览器配置——将扩展路径添加到 OpenClaw 的浏览器配置中,这样在 Chrome 启动时通过 --load-extension 加载

  4. 注入代理上下文——使用 before_agent_start 钩子在 AI 代理中预加载行为指令,告诉它在有验证小部件的页面上提交表单前等待


完整配置参考

这是包含所有 CapSolver 相关选项的完整 ~/.openclaw/openclaw.json 配置:

json 复制代码
{
  "browser": {
    "enabled": true,
    "executablePath": "/path/to/chrome-for-testing/chrome",
    "noSandbox": true,
    "defaultProfile": "openclaw"
  },
  "plugins": {
    "entries": {
"capsolver": {
        "enabled": true,
        "config": {
          "apiKey": "CAP-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX",
          "autoDownload": true,
          "solvingMode": "token"
        }
      }
    }
  }
}

配置选项

选项 默认值 描述
apiKey 您的CapSolver API密钥(必需,或使用 CAPSOLVER_API_KEY 环境变量)
autoDownload true 在网关启动时自动下载Chrome扩展程序
solvingMode "token" "token"(注入令牌,支持无头模式)或 "click"(模拟点击)

故障排除

扩展未加载

症状: 网关日志显示 Loading 1 extension(s) 但CDP中没有 chrome-extension:// 目标出现。

原因: 您使用的是品牌版Google Chrome 137+,它会静默忽略 --load-extension

解决方法: 切换到Chrome for Testing或Chromium。在您的配置中更新 browser.executablePath 以指向正确的二进制文件。

验证您的Chrome版本:

bash 复制代码
/path/to/your/chrome --version
# Chrome for Testing: "Chromium 143.0.7499.4"
# 品牌版Chrome: "Google Chrome 143.0.7499.109"

CAPTCHA 未解决(表单失败)

可能原因:

  1. 等待时间不足 — 增加到60秒
  2. 无效的API密钥 — 检查您的CapSolver仪表板
  3. 余额不足 — 为您的CapSolver账户充值
  4. 扩展未加载 — 参见“扩展未加载”部分

浏览器在首次操作时超时

症状: 网关重启后首次浏览器操作超时,但后续操作正常。

原因: Chromium冷启动 + Playwright CDP连接重试可能在第一次尝试时超过20秒工具超时。

解决方法: 这是一个已知问题。只需重试命令——第二次尝试将成功,因为浏览器现在已启动。

切换浏览器后Chrome崩溃

症状: 从品牌版Chrome切换到Chrome for Testing后,浏览器因磁盘缓存错误崩溃。

原因: 用户数据目录由不同版本的Chrome创建,不兼容。

解决方法: 删除旧的浏览器配置文件并重启:

bash 复制代码
rm -rf ~/.openclaw/browser/openclaw/user-data
# 然后重启网关

最佳实践

1. 始终使用充足的等待时间

更多等待时间总是更安全。CAPTCHA通常在5-20秒内解决,但网络延迟、复杂挑战或重试可能会增加时间。30-60秒是最佳选择。

2. 保持消息自然

不要使用:

"导航到URL,等待验证码解决,然后提交"

而是使用:

"转到URL,等待大约一分钟,然后提交表单"

自然的表达方式与AI配合更好,避免触发安全拒绝。

3. 监控您的CapSolver余额

每次CAPTCHA解决都会消耗积分。定期检查您的余额以避免中断 capsolver.com/dashboard

4. 在服务器上使用 noSandbox

在远程服务器、Docker容器或CI环境中运行OpenClaw时,始终在浏览器配置中设置 noSandbox: true。Chrome沙箱需要特殊的内核功能,这在大多数服务器环境中不可用。

5. 在无头服务器上设置 DISPLAY

Chrome扩展程序需要显示,即使在无头服务器上也是如此。使用Xvfb创建虚拟显示:

bash 复制代码
# 安装Xvfb
sudo apt-get install xvfb

# 启动虚拟显示
Xvfb :99 -screen 0 1280x720x24 &

# 为OpenClaw设置DISPLAY
export DISPLAY=:99

结论

OpenClaw + CapSolver集成代表了一种全新的验证码解决方法。无需编写代码来检测验证码、调用API和注入令牌,您只需:

  1. 在配置中启用插件
  2. 指向Chromium(不是品牌版Chrome)
  3. 自然地与您的AI交流——在表单提交前包括等待时间

CapSolver Chrome扩展程序会处理其余工作——检测验证码,通过CapSolver API解决,并将令牌注入页面。您的AI助手根本不需要知道验证码的存在。

这就是拥有AI助手时的验证码解决方式:隐形、自动且零代码。


准备开始了吗? 注册CapSolver 并使用优惠码 OPENCLAW 在首次充值时获得额外6%的奖励!


常见问题

我需要告诉AI关于CapSolver吗?

不需要。 实际上,您应避免在消息中提及验证码或CapSolver。扩展程序在后台 invisibly 工作。只需在指令中包括等待时间(例如,“等待60秒,然后提交”)以给扩展程序时间解决页面上的任何验证码。

为什么不能使用常规的Google Chrome?

Google Chrome 137+(2025年中发布)在品牌版中移除了 --load-extension 命令行标志的支持。这意味着无法在自动化会话中加载Chrome扩展程序。您需要Chrome for Testing或独立的Chromium,它们仍支持此标志。

CapSolver支持哪些验证码类型?

CapSolver支持reCAPTCHA v2(复选框和不可见)、reCAPTCHA v3、Cloudflare Turnstile、AWS WAF验证码等。Chrome扩展程序会自动检测验证码类型并相应解决。

CapSolver的成本是多少?

CapSolver提供基于验证码类型和数量的有竞争力的定价。访问 capsolver.com 查看当前定价。

OpenClaw是免费的吗?

OpenClaw是开源的,可在自己的硬件上免费运行。您需要AI模型提供商的API密钥,以及CapSolver账户和积分用于验证码解决。

应该告诉AI等待多久?

对于大多数验证码,30-60秒足够。实际解决时间通常为5-20秒,但增加额外缓冲以确保可靠性。不确定时,使用60秒。

可以在无头服务器上使用吗?

可以。您需要Xvfb(X虚拟帧缓冲区)来提供显示,因为Chrome扩展程序需要显示上下文。设置 DISPLAY=:99 并在后台运行 Xvfb :99。同时在浏览器配置中设置 noSandbox: true

合规声明: 本博客提供的信息仅供参考。CapSolver 致力于遵守所有适用的法律和法规。严禁以非法、欺诈或滥用活动使用 CapSolver 网络,任何此类行为将受到调查。我们的验证码解决方案在确保 100% 合规的同时,帮助解决公共数据爬取过程中的验证码难题。我们鼓励负责任地使用我们的服务。如需更多信息,请访问我们的服务条款和隐私政策。

更多

在OpenClaw中破解验证码
如何在OpenClaw中解决验证码:使用CapSolver扩展的逐步指南

在OpenClaw中无需编写代码即可通过加载CapSolver Chrome扩展解决CAPTCHAs。自动解决reCAPTCHA、Turnstile等更多类型。

AI
Logo of CapSolver

Emma Foster

10-Feb-2026

CapSolver 人工智能-大语言模型架构实践
CapSolver人工智能 CapSolver人工智能-大语言模型架构在实践中的应用:构建自适应CAPTCHA识别系统的决策流水线

探索CapSolver的人工智能大语言模型架构,用于自适应验证码破解,结合视觉、推理和自主决策。

AI
Logo of CapSolver

Emma Foster

10-Feb-2026

代理AI新闻:为什么网页自动化在CAPTCHA上持续失败
代理AI新闻:为什么网页自动化在CAPTCHA上持续失败

了解AI代理为何难以应对网页自动化和CAPTCHA。了解如何通过CapSolver的解决方案弥合人工智能推理与执行之间的差距。

AI
Logo of CapSolver

Nikolai Smirnov

05-Feb-2026

Crawl4AI 对 Firecrawl
Crawl4AI 与 Firecrawl:2026年全面对比与评测

比较Crawl4AI与Firecrawl在2026年的表现。了解这些AI网络爬虫工具的功能、价格和性能,用于适用于大语言模型的Markdown提取。

AI
Logo of CapSolver

Ethan Collins

04-Feb-2026

浏览器使用与Browserbase:哪种浏览器自动化工具更适合AI代理?
浏览器使用与Browserbase:哪种浏览器自动化工具更适合AI代理?

比较Browser Use与Browserbase在AI代理自动化中的应用。了解功能、价格以及如何通过CapSolver解决CAPTCHAs以实现无缝工作流程。

AI
Logo of CapSolver

Aloísio Vítor

27-Jan-2026

2026年前9名人工智能代理框架
2026年最顶尖的9个AI代理框架

探索2026年的顶级9个AI代理框架,包括CrewAI、AutoGen和LangGraph。学习如何为多智能体编排和自主代理开发选择最佳框架,并发现用于现实世界网络交互的关键工具。

AI
Logo of CapSolver

Lucas Mitchell

26-Jan-2026