OpenClawでCAPTCHAを解決する方法: CapSolver拡張機能とのステップバイステップガイド

Sora Fujimoto
AI Solutions Architect
11-Feb-2026

はじめに
AIアシスタントがWebをあなたの代わりにブラウズするとき、CAPTCHAは最大の障壁です。保護されたページはエージェントをブロックし、フォームは送信できず、タスクは人間の介入を待って停止します。
OpenClawは、自然言語を通じてWebをブラウズし、フォームを入力し、ボタンをクリックし、データを抽出できる個人用AIアシスタントです。しかし、あらゆるブラウザ自動化と同様に、CAPTCHAで詰まってしまいます。
CapSolver はこれを完全に変えるものです。OpenClawのブラウザにCapSolverのChrome拡張機能を読み込むことで、CAPTCHAは自動的かつ非表示でバックグラウンドで解決されます。コードは必要ありません。あなたの側からのAPI呼び出しも必要ありません。AIアシスタントに話す方法に変更は必要ありません。
最高の点は、AIにCAPTCHAについて言及する必要すらありません。ただ、送信する前に少し待つように指示するだけで、そのときにはCAPTCHAはすでに解決されています。
OpenClawとは何か?
OpenClawは、自分のデバイスで実行する個人用AIアシスタントです。あなたがすでに使っているチャネル(WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Google Chat、Microsoft Teamsなど)でAIに答えさせることができます。

主な特徴
- マルチチャネル受信トレイ: WhatsApp、Discord、Telegram、SlackなどからAIに話しかけられます
- 組み込みブラウザ: エージェントはタブを開き、ページを移動し、ボタンをクリックし、フォームを入力し、スクリーンショットを撮ることができます
- ローカル優先: 自分のハードウェアで動作します — データはあなたに残ります
- 拡張機能システム: カスタム拡張機能と統合を拡張できます
- 音声サポート: macOS、iOS、AndroidでAIに話しかけられます
ブラウザツール
OpenClawはエージェントのみが制御する専用のChromiumブラウザプロファイルを実行します。これはあなたの個人ブラウザから完全に隔離されています。エージェントは以下ができます:
- 任意のURLを開き、移動します
- ページの内容を読み取り、スナップショットを撮ります
- ボタンをクリックし、フォームを入力し、ドロップダウンを選択します
- スクリーンショットを撮り、PDFを作成します
- 複数のタブを管理します
これは、AIアシスタントに独自のブラウザウィンドウを与えるようなものです。
CapSolverとは何か?
CapSolverは、さまざまなCAPTCHAチャレンジを回避するためのAI駆動のソリューションを提供する、リーディングなCAPTCHA解決サービスです。複数のCAPTCHAタイプをサポートし、高速な応答時間を提供し、自動ワークフローにシームレスに統合されます。
サポートされているCAPTCHAタイプ
- reCAPTCHA v2 (画像ベース & インビジブル)
- reCAPTCHA v3 & v3 Enterprise
- Cloudflare Turnstile
- Cloudflare 5秒チャレンジ
- AWS WAF CAPTCHA
- その他の広く使用されているCAPTCHAおよびアンチボットメカニズム
この統合が異なる理由
ほとんどのCAPTCHA解決の統合では、コードを書く必要があります — API呼び出しを作成し、結果をポーリングし、隠しフォームフィールドにトークンを挿入します。CrawleeやPuppeteer、Playwrightなどのツールでこれが行われます。
OpenClaw + CapSolverは根本的に異なります:
| 伝統的な(コードベース) | OpenClaw(自然言語) |
|---|---|
CapSolverServiceクラスを書く |
設定に拡張機能のパスを追加する |
createTask() / getTaskResult()を呼び出す |
AIに話しかけるだけでよい |
page.$eval()でトークンを挿入する |
拡張機能がすべてを処理する |
| コードでエラー、リトライ、タイムアウトを処理する | 「60秒待ってから送信してください」と指示する |
| 各CAPTCHAタイプごとに異なるコード | すべてのタイプを自動的に処理する |
重要な洞察: CapSolverのChrome拡張機能はエージェントのブラウザセッション内で実行されます。エージェントがCAPTCHAのあるページに移動すると、拡張機能はそれを検出し、バックグラウンドで解決し、トークンを挿入します — エージェントがフォームを送信しようとする前にすべてが完了します。
ただ、時間を与える必要があります。 AIに「CAPTCHAを解決してください」と言うのではなく、単に以下のように指示するだけでよいです:
「そのページに移動し、60秒待ってから送信してください。」
それだけです。AIはCapSolverについて知る必要すらありません。
前提条件
統合をセットアップする前に、以下のものを確認してください:
- OpenClawがインストールされ、ゲートウェイが動作していること
- CapSolverアカウントとAPIキー(ここから登録)
- テスト用のChromiumまたはChrome(以下の重要な注意事項を参照)
重要: Google ChromeではなくChromiumを使用してください
Google Chrome 137+(2025年中盤リリース)は、ブランド構築で「--load-extension」を非表示に削除しました。 これにより、標準的なGoogle Chromeで自動セッションにChrome拡張機能をロードすることはできません。エラーは表示されません — フラグは単に無視されます。
これはGoogle ChromeとMicrosoft Edgeに影響します。以下の代替手段を使用する必要があります:
| ブラウザ | 拡張機能のロード | 推奨? |
|---|---|---|
| Google Chrome 137+ | サポートされていません | いいえ |
| Microsoft Edge | サポートされていません | いいえ |
| Chrome for Testing | サポートされています | はい |
| Chromium(スタンドアロン) | サポートされています | はい |
| PlaywrightのバンドルChromium | サポートされています | はい |
Chrome for Testingのインストール方法:
bash
# オプション1: Playwright経由(推奨)
npx playwright install chromium
# バイナリのパスは以下のようになります:
# ~/.cache/ms-playwright/chromium-XXXX/chrome-linux64/chrome (Linux)
# ~/Library/Caches/ms-playwright/chromium-XXXX/chrome-mac/Chromium.app/Contents/MacOS/Chromium (macOS)
bash
# オプション2: Chrome for Testingの直接ダウンロード
# 以下にアクセス: https://googlechromelabs.github.io/chrome-for-testing/
# ご使用のOSに一致するバージョンをダウンロード
インストール後、バイナリの完全なパスを記録してください — 設定で必要になります。
ステップバイステップのセットアップ
ステップ1: CapSolver Chrome拡張機能をダウンロード
CapSolver Chrome拡張機能をダウンロードし、~/.openclaw/capsolver-extension/に抽出します:
- CapSolver拡張機能のリリースをGitHubで確認
- 最新の
CapSolver.Browser.Extension-chrome-vX.X.X.zipをダウンロード - zipを抽出:
bash
mkdir -p ~/.openclaw/capsolver-extension
unzip CapSolver.Browser.Extension-chrome-v*.zip -d ~/.openclaw/capsolver-extension/
- 抽出が成功したか確認:
bash
ls ~/.openclaw/capsolver-extension/manifest.json
manifest.jsonが表示されるはずです — これにより拡張機能が正しい場所にあることが確認されます。
ステップ2: CapSolver APIキーを設定
~/.openclaw/capsolver-extension/assets/config.jsの拡張機能の設定ファイルを開き、apiKeyの値を自分のものに置き換えます:
js
export const defaultConfig = {
apiKey: 'CAP-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX', // ← ここにあなたのキーを
useCapsolver: true,
// ... その他の設定
};
あなたのAPIキーはCapSolverダッシュボードから取得できます。
ステップ3: ブラウザを設定
~/.openclaw/openclaw.jsonのOpenClaw設定ファイルを編集し、ブラウザを有効にして拡張機能をロードします:
json
{
"browser": {
"enabled": true,
"executablePath": "/path/to/chrome-for-testing/chrome",
"extensions": [
"~/.openclaw/capsolver-extension"
],
"noSandbox": true,
"defaultProfile": "openclaw"
}
}
**/path/to/chrome-for-testing/chrome**を、実際のChrome for TestingまたはChromiumのバイナリのパスに置き換えてください。例えば:
- Linux (Playwright):
~/.cache/ms-playwright/chromium-1200/chrome-linux64/chrome - macOS (Playwright):
~/Library/Caches/ms-playwright/chromium-1200/chrome-mac/Chromium.app/Contents/MacOS/Chromium
注意: 多くのサーバーエンバイロメント、Dockerコンテナ、CIシステムでは
noSandbox: trueが必要です。適切なサンドボックスが設定されているデスクトップシステムでは、この設定を省略できます。
ステップ4: ゲートウェイを再起動
bash
# PM2を使用している場合:
pm2 restart opencrawl --update-env
# 直接実行している場合:
openclaw gateway restart
ステップ5: 設定の確認
ゲートウェイのログを確認して、すべてが正しく読み込まれたか確認します:
bash
pm2 logs opencrawl --lines 20 --nostream
以下のキーラインが表示されるはずです:
[browser/chrome] 1つの拡張機能をロードしています
[browser/chrome] Chromeを起動中: /path/to/chrome-for-testing (引数: 15)
上級チェック — Chrome DevTools Protocol経由で拡張機能がアクティブか確認します:
bash
curl -s http://127.0.0.1:8091/json/list
chrome-extension://がURLに含まれるservice_workerエントリが表示されるはずです:
json
{
"title": "Service Worker chrome-extension://cnopfoopenkdblckmekkipihdnambjhf/background.js",
"type": "service_worker",
"url": "chrome-extension://cnopfoopenkdblckmekkipihdnambjhf/background.js"
}
このように表示されれば、CapSolverがロードされ、動作していることが確認されます。

使用方法
これは最も重要なセクションです。セットアップが完了したら、OpenClawでCapSolverを使用するのは非常に簡単です。
ロールのルール
CAPTCHAやCapSolverについてAIに言及しないでください。 フォームの送信前に少し時間を与えるだけです。
AIエージェントはCAPTCHAについて知る必要はありません。拡張機能がバックグラウンドですべてを処理します。あなたがする必要があるのは、指示に待機時間を含めることだけです。これにより、拡張機能がフォームが送信される前にチャレンジを解決する時間が確保されます。
例1:
Discord、WhatsApp、Telegram、または他のチャネルを通じてOpenClawエージェントに以下を送信します:
https://example.comに移動し、60秒待ってから「送信」をクリックし、ページに表示されるテキストを教えてください。
裏で起こること:
- エージェントはreCAPTCHAデモページに移動します
- CapSolverのコンテンツスクリプトがreCAPTCHAウィジェットを検出します
- 拡張機能はCapSolver APIを呼び出し、チャレンジを解決します(通常10〜20秒かかります)
- トークンが隠しフォームフィールドに挿入されます
- 60秒後にエージェントは「送信」をクリックします
- ページには**「検証成功... おめでとう!」**と表示されます
例2: 保護されたサイトにログイン
https://example.com/loginに移動し、メールフィールドに「[email protected]」、パスワードに「mypassword123」を入力し、30秒待って「ログイン」ボタンをクリックしてください。ログイン後のページを教えてください。
例3: Turnstileの後ろにあるフォームを送信
https://example.com/contactを開き、連絡フォームに入力します:
- 名前: "John Doe"
- メール: "[email protected]"
- メッセージ: "こんにちは、サービスについて質問があります。"
45秒待って「メッセージを送信」をクリックしてください。確認メッセージは何ですか?
推奨される待機時間
| CAPTCHAタイプ | 通常の解決時間 | 推奨される待機時間 |
|---|---|---|
| reCAPTCHA v2(チェックボックス) | 5〜15秒 | 30〜60秒 |
| reCAPTCHA v2(インビジブル) | 5〜15秒 | 30秒 |
| reCAPTCHA v3 | 3〜10秒 | 20〜30秒 |
| Cloudflare Turnstile | 3〜10秒 | 20〜30秒 |
ヒント: 不明な場合は60秒を使用してください。早すぎる送信よりも少し長く待つほうが良いです。余分な待機時間は結果に影響しません。
効果的な自然言語のパターン
以下は使用できる検証済みの表現です:
- "URLに移動し、60秒待ってからフォームを送信してください"
- "URLに移動し、[フィールド]を入力し、30秒待って[ボタン]をクリックしてください"
- "URLを開き、約1分後に「送信」をクリックし、結果を教えてください"
- "URLにアクセスし、ページが完全に読み込まれるのを少し待ってから送信してください"
してはいけない表現
これらを避けてください — AIを混乱させたり、拒否させたりする可能性があります:
"CAPTCHAが解決されるのを待ってください"(AIはCAPTCHAについて知らないため)"CapSolverで検証を解決してください"(AIは拡張機能を制御できません)"reCAPTCHAのチェックボックスをクリックしてください"(拡張機能が処理します — クリックは干渉する可能性があります)
背後での動作
技術的に興味のある方のために、CapSolver拡張機能がロードされたときの動作を以下に示します:
あなたのメッセージ OpenClawゲートウェイ
───────────────────────────────────────────────────
"ページに移動し、 ──► AIエージェントがメッセージを受け取ります
60秒待って送信" │
▼
ブラウザツール: URLに移動
│
▼
Chromiumがページを読み込みます
┌─────────────────────────────┐
│ reCAPTCHAウィジェットのあるページ │
│ │
│ CapSolver拡張機能: │
│ 1. コンテンツスクリプトが │
│ ページ上のreCAPTCHAを検出します │
│ 2. サービスワーカーが │
│ CapSolver APIを呼び出します │
│ 3. トークンが受信されます │
│ 4. トークンが隠しフォームフィールドに挿入されます │
└─────────────────────────────┘
│
▼
AIエージェントが60秒待機...
│
▼
ブラウザツール: 「送信」をクリック
│
▼
有効なトークン付きでフォームが送信されます
│
▼
"検証成功!"
拡張機能のロード方法
OpenClawのブラウザが起動するとき、設定からextensionsリストを読み込み、各パスをChromeに--load-extensionフラグで渡します。これはChromeが開発者拡張機能に使用するメカニズムと同じです — 特別なプラグインシステムは必要ありません。
- Chromeが
--load-extension=~/.openclaw/capsolver-extensionで起動します - 拡張機能がアクティブになります — サービスワーカーが起動し、すべてのページにコンテンツスクリプトが挿入されます
- CAPTCHAのあるページでは — コンテンツスクリプトがウィジェットを検出し、CapSolver APIを呼び出し、ページに解決トークンを挿入します
完全な設定リファレンス
以下はCapSolver拡張機能を含む~/.openclaw/openclaw.jsonの完全な設定です:
json
{
"browser": {
"enabled": true,
"executablePath": "/path/to/chrome-for-testing/chrome",
"extensions": [
"~/.openclaw/capsolver-extension"
],
"noSandbox": true,
"defaultProfile": "openclaw"
}
}
設定オプション
| オプション | 説明 |
|---|---|
browser.executablePath |
Chrome for TestingまたはChromiumのバイナリへのパス(必須) |
browser.extensions |
Chromeにロードする拡張機能のディレクトリパスの配列 |
browser.noSandbox |
サーバー/Dockerでtrueに設定(Chromeのサンドボックスは特別なカーネル機能を必要とする) |
browser.defaultProfile |
ブラウザプロファイル名(デフォルト: "chrome") |
CapSolver APIキーは拡張機能のassets/config.jsファイルに直接設定されています(上記のステップ2を参照)。
トラブルシューティング
拡張機能がロードされない
症状: ゲートウェイログにLoading 1 extension(s)と表示されるが、CDPにchrome-extension://のターゲットが表示されない。
原因: ブランド版Google Chrome 137+を使用しているため、--load-extensionが無視されている。
解決策: Chrome for TestingまたはChromiumに切り替える。設定ファイルのbrowser.executablePathを正しいバイナリに更新する。
Chromeバージョンの確認:
bash
/path/to/your/chrome --version
# Chrome for Testing: "Chromium 143.0.7499.4"
# ブランド版Chrome: "Google Chrome 143.0.7499.109"
CAPTCHAが解決されない(フォームが失敗)
可能性のある原因:
- 待機時間が不足している — 60秒に増やす
- 無効なAPIキー — CapSolverダッシュボードを確認
- 残高が不足している — CapSolverアカウントに残高を追加
- 拡張機能がロードされていない — 上記の「拡張機能がロードされない」を参照
最初のアクションでブラウザタイムアウト
症状: ゲートウェイを再起動した後、最初のブラウザアクションがタイムアウトするが、以降のアクションは動作する。
原因: Chromiumのコールドスタート + Playwright CDP接続の再試行が、最初の試行で20秒のツールタイムアウトを超える。
解決策: この問題は既知のものです。コマンドを再試行してください — 2回目の試行ではブラウザが起動しているため成功します。
ブラウザを切り替えた後にChromeがクラッシュ
症状: ブランド版ChromeからChrome for Testingに切り替えた後、ブラウザがディスクキャッシュエラーでクラッシュする。
原因: 別のChromeバージョンで作成されたユーザーデータディレクトリが互換性がない。
解決策: 古いブラウザプロファイルを削除し、再起動:
bash
rm -rf ~/.openclaw/browser/openclaw/user-data
# その後ゲートウェイを再起動
最適な実践方法
1. 常に余裕のある待機時間を設定する
より長い待機時間は常に安全です。CAPTCHAは通常5〜20秒で解決されますが、ネットワーク遅延、複雑なチャレンジ、または再試行により時間がかかることがあります。30〜60秒が最適です。
2. メッセージを自然に保つ
以下のようにするのではなく:
"URLに移動し、CAPTCHAソルバーを待ってから送信"
以下のようにしてください:
"URLに移動し、約1分待ってからフォームを送信"
自然な表現はAIとより効果的で、セーフティ拒否を避けることができます。
3. CapSolver残高を監視する
CAPTCHAの解決にはクレジットが必要です。capsolver.com/dashboardで残高を定期的に確認し、中断を防いでください。
4. サーバーでnoSandboxを使用する
OpenClawをリモートサーバー、Dockerコンテナ、またはCI環境で実行する際は、設定ファイルのbrowserでnoSandbox: trueを常に設定してください。Chromeのサンドボックスはほとんどのサーバー環境では利用できない特別なカーネル機能を必要とします。
5. ヘッドレスサーバーでDISPLAYを設定する
Chrome拡張機能はヘッドレスサーバーでもディスプレイが必要です。Xvfbを使用して仮想ディスプレイを作成してください:
bash
# Xvfbのインストール
sudo apt-get install xvfb
# 仮想ディスプレイの起動
Xvfb :99 -screen 0 1280x720x24 &
# OpenClawでDISPLAYを設定
export DISPLAY=:99
結論
OpenClaw + CapSolverの統合は、CAPTCHA解決の根本的な新しいアプローチを提供します。CAPTCHAを検出するコードを書く、APIを呼び出す、トークンを挿入するのではなく、単に以下を行います:
- 拡張機能をダウンロードし、設定に追加
- Chromiumにポイント(ブランド版Chromeではなく)
- AIに自然に話す — フォーム送信前に待機時間を含めてください
CapSolver Chrome拡張機能はすべての処理を自動で行います — CAPTCHAの検出、CapSolver APIを通じた解決、ページへのトークンの挿入。AIアシスタントはCAPTCHAについて一切知る必要がありません。
AIアシスタントを持つ場合のCAPTCHA解決の姿は、目に見えず、自動的、ゼロコードです。
始めてみましょうか? CapSolverに登録し、初回チャージでOPENCLAWというボーナスコードを使用してください!
FAQ
AIにCapSolverについて伝える必要がありますか?
いいえ。 実際には、メッセージの中でCAPTCHAやCapSolverについて言及しないようにしてください。拡張機能はバックグラウンドで無視して動作します。CAPTCHAがページに表示されている場合に解決する時間を確保するために、指示に「60秒待ってから送信」などの待機時間を含めてください。
なぜ通常のGoogle Chromeは使用できないのですか?
2025年中盤にリリースされたGoogle Chrome 137+では、ブランド版のビルドでは--load-extensionコマンドラインフラグが削除されました。これにより、ブランド版Chromeでは自動化されたセッションで拡張機能をロードできなくなりました。このフラグをまだサポートしているChrome for TestingまたはスタンドアロンのChromiumを使用する必要があります。
CapSolverがサポートするCAPTCHAの種類は?
CapSolverはreCAPTCHA v2(チェックボックスおよび非表示)、reCAPTCHA v3、Cloudflare Turnstile、AWS WAF CAPTCHAなどに対応しています。Chrome拡張機能は自動的にCAPTCHAの種類を検出し、それに応じて解決します。
CapSolverの料金はどのくらいですか?
CapSolverはCAPTCHAの種類と量に基づいて競争力のある価格を提供しています。最新の料金はcapsolver.comをご覧ください。
OpenClawは無料ですか?
OpenClawはオープンソースで、自分のハードウェアで無料で実行できます。AIモデルプロバイダーのAPIキーと、CAPTCHA解決用のCapSolverアカウントとクレジットが必要です。
AIにどのくらいの待機時間を指示すべきですか?
ほとんどのCAPTCHAでは、30〜60秒が十分です。実際の解決時間は通常5〜20秒ですが、余分なバッファを追加することで信頼性を確保します。疑問がある場合は、60秒を使用してください。
ヘッドレスサーバーで使用できますか?
はい。Chrome拡張機能はディスプレイコンテキストを必要とするため、Xvfb(X Virtual Framebuffer)を使用する必要があります。DISPLAY=:99を設定し、バックグラウンドでXvfb :99を実行してください。また、ブラウザ設定でnoSandbox: trueを設定してください。
コンプライアンス免責事項: このブログで提供される情報は、情報提供のみを目的としています。CapSolverは、すべての適用される法律および規制の遵守に努めています。CapSolverネットワークの不法、詐欺、または悪用の目的での使用は厳格に禁止され、調査されます。私たちのキャプチャ解決ソリューションは、公共データのクローリング中にキャプチャの問題を解決する際に100%のコンプライアンスを確保しながら、ユーザーエクスペリエンスを向上させます。私たちは、サービスの責任ある使用を奨励します。詳細については、サービス利用規約およびプライバシーポリシーをご覧ください。
もっと見る

OpenClawでCAPTCHAを解決する方法: CapSolver拡張機能とのステップバイステップガイド
OpenClawでゼロコードでCAPTCHAを解決し、CapSolverのChrome拡張を読み込んでください。reCAPTCHA、Turnstileなど、自動で解決します。

Sora Fujimoto
11-Feb-2026

CapSolver AI-LLMアーキテクチャの実践: 適応型CAPTCHA認識システムの意思決定パイプライン構築
CapSolverのAI-LLMアーキテクチャを探索し、視覚、推論、および自律的な意思決定を統合した適応型CAPTCHA解決を実現します。

Sora Fujimoto
10-Feb-2026

Crawl4AI 対 Firecrawl: 完全な比較 & 2026年レビュー
2026年のCrawl4AIとFirecrawlを比較する。LLM対応のマーカドン抽出用のこれらのAIウェブスクレイピングツールの特徴、価格、パフォーマンスを確認する。

Sora Fujimoto
04-Feb-2026

ブラウザの利用 vs ブラウザベース: AIエージェントに適したブラウザ自動化ツールはどちらですか?
AIエージェントの自動化において、ブラウザの使用とBrowserbaseを比較する。CapSolverを使ってCAPTCHAを解決する方法、特徴、価格を確認し、スムーズなワークフローを実現する。

Adélia Cruz
26-Jan-2026

エージェンティックAIニュース: ウェブオートメーションがCAPTCHAでなぜ繰り返し失敗しているのか
AIエージェントがウェブ自動化とCAPTCHAで苦労する理由を発見してください。CapSolverのソリューションを使用して、AIの推論と実行のギャップを埋める方法を学びましょう。

Emma Foster
26-Jan-2026

2026年の上位9 AIエージェントフレームワーク
2026年の上位9つのAIエージェントフレームワークを探索し、CrewAI、AutoGen、LangGraphを含む。マルチエージェントのオーケストレーションや自律型エージェント開発に最適なフレームワークを選ぶ方法を学び、実世界でのウェブインタラクションに必要なツールを発見します。

Anh Tuan
26-Jan-2026


