
Sora Fujimoto
AI Solutions Architect

UI.Visionは、ChromeとFirefox向けの一般的なオープンソースRPAおよびブラウザ自動化拡張機能です。ウェブスクレイピング、データ抽出、自動テスト、フォーム入力などに広く使用されており、開発者も非開発者も、ブラウザ内で直接マクロを作成したり、Selenium IDEスクリプトを実行したりできます。ただし、CAPTCHAで保護されたWebサイトを扱う場合、これらの自動化はしばしば中断し、手動での解決が必要になります。
CapSolverは、大規模なスクレイピング、クロール、ブラウザ自動化のために設計されたAI搭載のCAPTCHA解決サービスです。reCAPTCHA、Cloudflare Turnstile、その他の一般的な課題を自動的に解決できます。CapSolver拡張機能とUI.Visionを組み合わせることで、問題なく完全にハンズフリーの自動化ワークフローを作成できます。
このガイドでは、セットアップ、すぐに使用できるマクロの例、信頼性の高いWeb自動化のためのベストプラクティスなど、CapSolverをUI.Visionにすばやく統合する方法を示します。
UI.Vision RPAは、コンピュータビジョン(XModules経由)、API呼び出し、デスクトップ自動化などの高度な機能とビジュアルスクリプトを組み合わせた、多用途のブラウザ自動化ツールです。拡張機能として、Chrome、Firefox、Edgeをサポートするブラウザ内で直接実行され、ヘッドレスモードとコマンドライン実行のオプションがあります。無制限に使用できる無料版と、機能を強化するためのオプションの有料アドオンがあります。
UI.Visionは、次のようなさまざまな自動化タスクに適しています。
CAPTCHAは、特にログインページやフォームでこれらのシナリオによく表示されるため、中断のない実行には解決策の統合が不可欠です。
Webサイトは、UI.Visionマクロの実行途中で停止する可能性のある自動化されたボットをブロックするためにCAPTCHAを使用します。これらの防御策には人間の検証が必要なため、ヘッドレスまたはスケジュールされた自動化でエラーが発生します。
一般的なCAPTCHAの種類を次に示します。
| CAPTCHAの種類 | 説明 |
|---|---|
| reCAPTCHA v2 | ユーザーは、プロンプトに基づいてボックスにチェックを入れるか、画像を選択します。![]() |
| reCAPTCHA v3 | ユーザーの行動を評価するスコアリングシステムを使用し、ユーザーには見えないことがよくあります。 |
| Cloudflare Turnstile | ユーザーの操作を最小限に抑えるプライバシー重視のCAPTCHA代替手段です。![]() |
CapSolverのブラウザ拡張機能はこれらを自動的に検出して解決するため、UI.Visionは解決が完了するまで待機できます。
CapSolverは、ページ上のCAPTCHAを自動的に解決するブラウザ拡張機能を提供します。拡張機能をインストールし、マクロでwait/assertコマンドを使用して「解決済み」状態を検出することで、UI.Visionと統合します。
UI.VisionはJSONベースのマクロを使用します。次の例では、CapSolverの「解決済み」インジケーター(id='capsolver-solver-tip-button'とdata-state='solved'を持つ要素)を待機します。
以下は、CapSolverの拡張機能を使用してデモページでreCAPTCHA v2を解決する例を示す(JSON形式の)完全なUI.Visionマクロです。
{
"Name": "solve captcha",
"CreationDate": "2025-8-20",
"Commands": [
{
"Command": "open",
"Target": "https://www.google.com/recaptcha/api2/demo",
"Value": "",
"Description": ""
},
{
"Command": "waitForPageToLoad",
"Target": "",
"Value": "",
"Description": ""
},
{
"Command": "waitForElementPresent",
"Target": "xpath=//*[@id='capsolver-solver-tip-button' and @data-state='solved']",
"Value": "30000",
"Description": ""
},
{
"Command": "assertElementPresent",
"Target": "xpath=//*[@id='capsolver-solver-tip-button' and @data-state='solved']",
"Value": "",
"Description": ""
},
{
"Command": "click",
"Target": "id=recaptcha-demo-submit",
"Value": "",
"Description": ""
}
]
}
| 手順 | 説明 |
|---|---|
| 1. ページを開く | openを使用して、CAPTCHAが表示されるreCAPTCHAデモサイトに移動します。 |
| 2. ページの読み込みを待つ | waitForPageToLoadにより、続行する前にページが完全に読み込まれます。 |
| 3. CAPTCHAが解決されるのを待つ | waitForElementPresentは、CapSolverの解決済みインジケーター(data-state='solved'のボタンのXPath)をチェックし、30秒後にタイムアウトします。拡張機能はバックグラウンドで自動的に解決します。 |
| 4. 解決済みであることを確認する | assertElementPresentは、CAPTCHAが解決済みであることを確認します。そうでない場合、マクロは失敗します。 |
| 5. フォームを送信する | 解決済みになったら、clickで送信ボタンをクリックして操作を完了します。 |
| 6. 実行して監視する | UI.Visionでマクロを再生します。拡張機能は解決を処理し、ログに進行状況が表示されます。 |
このマクロは、CapSolver拡張機能がソリューションを自動的に挿入することに依存しています。
このマクロは、reCAPTCHAデモでCAPTCHAの解決を自動化します。
現実世界の使用では、解決に時間がかかる場合はタイムアウトを調整するか、エラー処理(ループなど)を追加します。
| 質問 | 回答 |
|---|---|
| CapSolverは何種類のCAPTCHAを解決できますか? | CapSolverはreCAPTCHA v2/v3、Cloudflare Turnstileなどをサポートしています。完全なリストについては、CapSolverドキュメントを参照してください。 |
| 異なるCAPTCHAの種類をどのように処理しますか? | 拡張機能は種類を自動的に検出します。CapSolverの設定でサポートされている種類を構成します。インジケーターが変更された場合はXPathを更新します。 |
| CapSolverがCAPTCHAを解決できない場合はどうなりますか? | マクロに再試行ループを追加するか、拡張機能のログを確認します。複雑なCAPTCHAの場合は待機時間を長くします。 |
| CapSolverを他のRPAツールで使用できますか? | はい、CapSolverの拡張機能は、ブラウザベースのツールであればどれでも動作します。コードベースのセットアップの場合はAPI統合が可能です。 |
| UI.VisionでCapSolverを使用する際にプロキシが必要ですか? | プロキシはIPブロックに役立ちます。高度なシナリオの場合は、拡張機能またはUI.Visionで構成します。 |
CapSolverのブラウザ拡張機能をUI.Visionと統合することで、RPAワークフローでのCAPTCHA処理が簡素化され、マクロを自律的に実行できます。この組み合わせにより、UI.Visionのビジュアル自動化とCapSolverのAI解決を組み合わせ、効率的で信頼性の高いタスクを実現します。
開始するには、CapSolverにサインアップして拡張機能をインストールします。UI.Visionをダウンロードして、サンプルマクロをインポートします。詳細については、CapSolverドキュメントとUI.Visionドキュメントを参照してください。さあ、CAPTCHAを自動化しましょう!
ui.visionユーザー向けボーナス: CapSolverアカウントを再チャージする際にプロモーションコードuivisionを使用すると、独占的な6%のボーナスクレジットを受け取ることができます。制限なし、有効期限なし。