
Rajinder Singh
Deep Learning Researcher

अपने AI सहायक को स्वचालित, सर्वर-साइड डेटा निष्कर्षण ट्रिगर करने में सक्षम करें — कोई ब्राउज़र इंजेक्शन नहीं, कोई कोड नहीं।
जब आपका AI एजेंट वेब नेविगेट करता है, तो CAPTCHA प्राथमिक बाधा होते हैं। सुरक्षित पृष्ठ एजेंट को ब्लॉक करते हैं, फॉर्म सबमिट नहीं किए जा सकते हैं, और कार्य रुक जाते हैं, मानवीय हस्तक्षेप की प्रतीक्षा करते हैं। यह स्वचालित डेटा स्क्रैपिंग और सूचना प्रसंस्करण में AI एजेंटों की दक्षता और स्वायत्तता को काफी सीमित करता है।
इस मुख्य समस्या को दूर करने के लिए, हम OpenClaw और CapSolver के संयोजन से दो शक्तिशाली समाधान प्रदान करते हैं:
दृष्टिकोण 1 — ब्राउज़र एक्सटेंशन एकीकरण
OpenClaw के ब्राउज़र वातावरण में CapSolver Chrome एक्सटेंशन लोड करें। एक्सटेंशन n8n की भागीदारी के बिना, क्लाइंट-साइड CAPTCHA का अदृश्य रूप से पता लगाता है और हल करता है, जिससे AI एजेंट पृष्ठों को नेविगेट करते समय सत्यापन को मूल रूप से बायपास कर सकता है। (देखें हमारी एक्सटेंशन दृष्टिकोण पर पूरी मार्गदर्शिका)
दृष्टिकोण 2 — सर्वर-साइड n8n स्वचालन पाइपलाइन (इस मार्गदर्शिका का फोकस)
OpenClaw एक एकल वेबहुक अनुरोध ट्रिगर करता है, और n8n फिर CapSolver API के माध्यम से CAPTCHA को हल करता है, फॉर्म सबमिट करता है, और आपके AI एजेंट को स्वच्छ पृष्ठ सामग्री लौटाता है। इस प्रक्रिया में, AI एजेंट कभी भी सीधे CAPTCHA सत्यापन को नहीं संभालता है।
आप क्या बनाएंगे:
एक सर्वर-साइड CAPTCHA स्वचालन पाइपलाइन जिसे OpenClaw वेबहुक के माध्यम से ट्रिगर करता है। n8n CAPTCHA को हल करने, फॉर्म सबमिट करने और आपके AI एजेंट को संसाधित पृष्ठ सामग्री वापस करने के लिए CapSolver का लाभ उठाएगा, जिससे डेटा निष्कर्षण कार्यों का सुचारू निष्पादन सुनिश्चित होगा।
शुरू करने से पहले, सुनिश्चित करें कि आपके पास निम्नलिखित वातावरण और उपकरण हैं:
openclaw gateway start)CapSolver n8n में एक आधिकारिक एकीकरण के रूप में उपलब्ध है, जिसके लिए किसी अतिरिक्त सामुदायिक नोड स्थापना की आवश्यकता नहीं है। आप अपने वर्कफ़्लो का निर्माण करते समय इसे सीधे नोड पैनल में पा सकते हैं। CapSolver नोड को आपके खाते से प्रमाणित करने में सक्षम करने के लिए, आपको n8n में एक क्रेडेंशियल बनाना होगा।
अपना n8n कैनवास खोलें, नोड जोड़ने के लिए + पर क्लिक करें, और CapSolver खोजें। यह नोड एक ही इकाई में कार्य निर्माण, मतदान और टोकन पुनर्प्राप्ति को संभालता है।
अपनी साख जोड़ने के चरण:
महत्वपूर्ण: आपके वर्कफ़्लो में प्रत्येक CapSolver नोड इस क्रेडेंशियल को संदर्भित करेगा। आपको इसे केवल एक बार बनाने की आवश्यकता है — आपके सभी CAPTCHA-समाधान वर्कफ़्लो समान क्रेडेंशियल साझा करेंगे। इसके अलावा, CapSolver आधिकारिक तौर पर एक समृद्ध GitHub कौशल भंडार प्रदान करता है, जहाँ आप CapSolver से संबंधित अधिक एकीकरण और उपयोग के मामलों का पता लगा सकते हैं, जिससे आपके AI एजेंट की क्षमताओं का और विस्तार होता है।
नीचे दी गई हर चीज़ एक उदाहरण है। URL, फ़ील्ड नाम, CAPTCHA प्रकार, सफलता की शर्तें, प्रतिक्रिया संरचना — यह सब यहाँ उपयोग की गई डेमो साइट के लिए विशिष्ट है। आपका वास्तविक लक्ष्य अलग होगा। प्रत्येक नोड कॉन्फ़िगरेशन को एक प्रारंभिक बिंदु के रूप में मानें, न कि एक तैयार सेटअप के रूप में।
pageText निकालता है।वेबहुक ──► CAPTCHA हल करें ──► टोकन सबमिट करें ──► सफलता? ──► परिणाम निकालें ──► वेबहुक का जवाब दें
└─► विफल चिह्नित करें ────┘
निम्नलिखित नोड्स के साथ "OpenClaw/Capsolver/n8n Scraper" नामक एक नया वर्कफ़्लो बनाएँ:
openclaw/scrapeReCaptchaV2TaskProxylesshttps://example.com/protected-pageYOUR_SITE_KEY (इसे पृष्ठ स्रोत में खोजें — data-sitekey खोजें)reCAPTCHA v3 का उपयोग कर रहे हैं? कार्य प्रकार को
ReCaptchaV3TaskProxylessमें बदलें और एक पृष्ठ क्रिया फ़ील्ड जोड़ें (उदा.,login,submit,homepage)। यह v3 के लिए आवश्यक है — यह वह क्रिया नाम है जिसे साइट Google के साथ पंजीकृत करती है। आप इसेgrecaptcha.execute(...)कॉल के पास पृष्ठ स्रोत में पाएंगे।ध्यान रखें कि प्रत्येक CAPTCHA प्रकार के अपने पैरामीटर का सेट होता है — कुछ फ़ील्ड जो v2 में वैकल्पिक हैं, v3 में आवश्यक हो जाते हैं, और v3 उन फ़ील्ड को उजागर कर सकता है जो v2 में बिल्कुल मौजूद नहीं हैं (जैसे
minScore)। अपने कार्य प्रकार द्वारा आवश्यक सटीक मापदंडों के लिए हमेशा CapSolver डॉक्स की जाँच करें।
यह नोड CapSolver API को कॉल करता है, हल की प्रतीक्षा करता है (आमतौर पर 5-20 सेकंड), और $json.data.solution.gRecaptchaResponse में टोकन लौटाता है।
https://example.com/protected-pageg-recaptcha-response = ={{ $json.data.solution.gRecaptchaResponse }}यह हल किए गए टोकन के साथ फॉर्म सबमिट करता है, ठीक वैसे ही जैसे एक ब्राउज़र करेगा।
ध्यान दें: टोकन कैसे सबमिट किया जाता है यह साइट के अनुसार भिन्न होता है। अधिकांश फॉर्म इसे अनुरोध बॉडी में
g-recaptcha-responseके रूप में उम्मीद करते हैं, लेकिन कुछ साइटें इसे JSON फ़ील्ड, कस्टम हेडर, या यहाँ तक कि कुकी या अलग नाम के रूप में भेजती हैं। यह निरीक्षण करने के लिए कि वास्तविक सबमिशन कैसा दिखता है, अपने ब्राउज़र के DevTools (नेटवर्क टैब) का उपयोग करें और इसे अपने HTTP अनुरोध नोड में मिरर करें।
$json.data में "recaptcha-success" शामिल हैदोनों शाखाएँ एक ही फ़ील्ड सेट करती हैं:
pageText = {{ $json.data }}सफलता और विफलता दोनों शाखाएँ pageText पास करती हैं — कॉलर परिणाम निर्धारित करने के लिए HTML का निरीक्षण कर सकता है।
इसे अपने पृष्ठ के अनुकूल बनाएँ: आप प्रतिक्रिया डेटा को कैसे पार्स और उपयोग करते हैं यह पूरी तरह से इस बात पर निर्भर करता है कि आप क्या चाहते हैं और लक्ष्य साइट क्या लौटाती है। कुछ पृष्ठ JSON लौटाते हैं, अन्य HTML लौटाते हैं, कुछ सफलता पर पुनर्निर्देशित करते हैं। आप एक विशिष्ट फ़ील्ड निकालना, एक तालिका पार्स करना, सत्र कुकी की जाँच करना, या HTML को पूरी तरह से हटाना चाह सकते हैं। सफलता की स्थिति (
"recaptcha-success") भी सिर्फ एक उदाहरण है — आपकी साइट का अपना संकेतक होगा। ये नोड एक प्रारंभिक बिंदु हैं; अपने उपयोग के मामले के लिए उन्हें अनुकूलित करने की अपेक्षा करें।
यह नोड वेबहुक प्रतिक्रिया में { pageText, savedAt } पास करता है और वैकल्पिक रूप से परिणाम को भंडारण में बनाए रखता है।
नोट: n8n का कोड नोड एक सैंडबॉक्स्ड VM में चलता है जो
require('fs')जैसे Node.js बिल्ट-इन को ब्लॉक करता है। डिस्क पर लिखने के लिए इसके बजाय एक निष्पादित कमांड नोड का उपयोग करें, या इस नोड को पूरी तरह से किसी भी n8n एकीकरण से बदलें जो आपके स्टैक में फिट बैठता है।
विकल्प A — स्थानीय JSON फ़ाइल (निष्पादित कमांड नोड):
एक साथ जंजीर वाले दो नोड्स का उपयोग करें:
नोड 7a — डेटा तैयार करें (कोड नोड):
const item = $input.first().json;
const now = new Date();
const savedAt = now.toISOString();
const data = { pageText: item.pageText || '', savedAt };
const encoded = Buffer.from(JSON.stringify(data)).toString('base64');
const cmd = 'python3 /path/to/save-result.py ' + encoded;
return [{ json: { cmd, pageText: data.pageText, savedAt } }];
नोड 7b — परिणाम सहेजें (निष्पादित कमांड नोड):
={{ $json.cmd }}जहाँ save-result.py base64 तर्क पढ़ता है और एक स्थानीय JSON फ़ाइल में जोड़ता है।
विकल्प B — कोई भी n8n-समर्थित संग्रहण:
n8n में लगभग हर स्टोरेज सिस्टम के लिए नेटिव नोड्स हैं। नोड 7 को इनमें से किसी से भी बदलें:
| संग्रहण | n8n नोड |
|---|---|
| Google Sheets | pageText + टाइमस्टैम्प के साथ एक पंक्ति जोड़ें |
| Airtable | एक रिकॉर्ड बनाएँ |
| Notion | एक डेटाबेस प्रविष्टि बनाएँ |
| PostgreSQL / MySQL | एक तालिका में INSERT करें |
| AWS S3 / Cloudflare R2 | एक JSON फ़ाइल अपलोड करें |
| Slack / Telegram | परिणाम को एक चैनल पर पोस्ट करें |
बस फ़ील्ड संपादित करें और वेबहुक का जवाब दें के बीच नोड को कनेक्ट करें, और इसे $json.pageText और एक टाइमस्टैम्प संग्रहीत करने के लिए कॉन्फ़िगर करें।
={{ JSON.stringify($json) }}एक बार बन जाने के बाद वर्कफ़्लो को सक्रिय करें। वेबहुक पथ यहाँ लाइव होगा:
POST http://127.0.0.1:3005/webhook/openclaw/scrape
नीचे दिए गए JSON को कॉपी करें और इसे Menu → Import from JSON के माध्यम से n8n में आयात करें। आयात करने के बाद, CAPTCHA हल करें नोड में अपना CapSolver क्रेडेंशियल चुनें।
{
"nodes": [
{
"parameters": {
"content": "## OpenClaw CAPTCHA Automation Pipeline\n\n### How it works\n\n1. Initiates the process with a webhook trigger.\n2. Attempts to solve CAPTCHA using a specialized service.\n3. Submits the CAPTCHA token for validation.\n4. Evaluates whether the token submission was successful.\n5. Sets the result and responds back via the webhook.\n\n### Setup steps\n\n- [ ] Configure the webhook trigger with the desired endpoint URL.\n- [ ] Set up CAPTCHA solving service credentials.\n- [ ] Ensure HTTP request configurations are valid for token submission.\n- [ ] Customize the success and failure response messages.\n\n### Customization\n\nYou can customize the success and failure conditions and responses in the 'Success?' node.",
"width": 480,
"height": 656
},
"type": "n8n-nodes-base.stickyNote",
"typeVersion": 1,
"position": [
-1312,
-352
],
"id": "de683912-ba9c-4879-9a8e-38190c4b236c",
"name": "Sticky Note"
},
{
"parameters": {
"content": "## Initialization and CAPTCHA solving\n\nStarts with a webhook trigger and solves the CAPTCHA using an external service.",
"width": 800,
"height": 272,
"color": 7
},
"type": "n8n-nodes-base.stickyNote",
"typeVersion": 1,
"position": [
-768,
-352
],
"id": "a1b2c3d4-e5f6-7890-1234-56789abcdef0",
"name": "Sticky Note"
},
{
"parameters": {
"httpMethod": "POST",
"path": "openclaw/scrape",
"responseMode": "responseNode",
"options": {}
},
"type": "n8n-nodes-base.webhook",
"typeVersion": 1,
"position": [
-704,
-256
],
"id": "b2c3d4e5-f6a7-8901-2345-6789abcdef01",
"name": "Webhook",
"webhookId": "c3d4e5f6-a7b8-9012-3456-789abcdef012"
},
{
"parameters": {
"taskType": "ReCaptchaV2TaskProxyless",
"websiteUrl": "https://example.com/protected-page",
"websiteKey": "YOUR_SITE_KEY"
},
"type": "n8n-nodes-capsolver.capSolver",
"typeVersion": 1,
"position": [
-480,
-256
],
"id": "d4e5f6a7-b8c9-0123-4567-89abcdef0123",
"name": "Solve CAPTCHA",
"credentials": {
"capSolverApi": {
"id": "e5f6a7b8-c9d0-1234-5678-9abcdef01234",
"name": "CapSolver account"
}
}
},
{
"parameters": {
"method": "POST",
"url": "https://example.com/protected-page",
"sendBody": true,
"bodyParameters": {
"parameters": [
{
"name": "g-recaptcha-response",
"value": "={{ $json.data.solution.gRecaptchaResponse }}"
}
]
},
"options": {}
},
"type": "n8n-nodes-base.httpRequest",
"typeVersion": 4.1,
"position": [
-256,
-256
],
"id": "f6a7b8c9-d0e1-2345-6789-abcdef012345",
"name": "Submit Token"
},
{
"parameters": {
"conditions": {
"string": [
{
"value1": "={{ $json.data }}",
"operation": "contains",
"value2": "recaptcha-success"
}
]
}
},
"type": "n8n-nodes-base.if",
"typeVersion": 1,
"position": [
-32,
-256
],
"id": "a7b8c9d0-e1f2-3456-789a-bcdef0123456",
"name": "Success?"
},
{
"parameters": {
"values": {
"string": [
{
"name": "pageText",
"value": "={{ $json.data }}"
}
]
},
"options": {}
},
"type": "n8n-nodes-base.set",
"typeVersion": 2,
"position": [
192,
-352
],
"id": "b8c9d0e1-f2a3-4567-89ab-cdef01234567",
"name": "Extract Result"
},
{
"parameters": {
"values": {
"string": [
{
"name": "pageText",
"value": "={{ $json.data }}"
}
]
},
"options": {}
},
"type": "n8n-nodes-base.set",
"typeVersion": 2,
"position": [
192,
-160
],
"id": "c9d0e1f2-a3b4-5678-9abc-def012345678",
"name": "Mark Failed"
},
{
"parameters": {
"respondWith": "json",
"responseBody": "={{ JSON.stringify($json) }}",
"options": {}
},
"type": "n8n-nodes-base.respondToWebhook",
"typeVersion": 1,
"position": [
416,
-352
],
"id": "d0e1f2a3-b4c5-6789-abcd-ef0123456789",
"name": "Respond to Webhook"
},
{
"parameters": {
"respondWith": "json",
"responseBody": "={{ JSON.stringify($json) }}",
"options": {}
},
"type": "n8n-nodes-base.respondToWebhook",
"typeVersion": 1,
"position": [
416,
-160
],
"id": "e1f2a3b4-c5d6-789a-bcde-f0123456789a",
"name": "Respond to Webhook"
}
],
"connections": {
"Webhook": {
"main": [
[
{
"node": "Solve CAPTCHA",
"type": "main",
"index": 0
}
]
]
},
"Solve CAPTCHA": {
"main": [
[
{
"node": "Submit Token",
"type": "main",
"index": 0
}
]
]
},
"Submit Token": {
"main": [
[
{
"node": "Success?",
"type": "main",
"index": 0
}
]
]
},
"Success?": {
"main": [
[
{
"node": "Extract Result",
"type": "main",
"index": 0
}
],
[
{
"node": "Mark Failed",
"type": "main",
"index": 0
}
]
]
},
"Extract Result": {
"main": [
[
{
"node": "Respond to Webhook",
"type": "main",
"index": 0
}
]
]
},
"Mark Failed": {
"main": [
[
{
"node": "Respond to Webhook",
"type": "main",
"index": 0
}
]
]
}
},
"pinData": {},
"meta": {
"instanceId": "962ff0267b713be0344b866fa54daae28de8ed2144e2e6867da355dae193ea1f"
}
}
OpenClaw को इस वर्कफ़्लो से जोड़ने के लिए, एक ट्रिगर स्क्रिप्ट बनाएँ और इसे पंजीकृत करें।
ट्रिगर स्क्रिप्ट बनाएँ:
cat > ~/.openclaw/scripts/extract-data << 'EOF'
#!/usr/bin/env bash
curl -s -X POST http://127.0.0.1:3005/webhook/openclaw/scrape
EOF
chmod +x ~/.openclaw/scripts/extract-data
यह एकमात्र चीज है जो OpenClaw चलाता है। कोई तर्क नहीं, कोई साइट कुंजी नहीं, कोई URL नहीं — वर्कफ़्लो जानता है कि क्या स्क्रैप करना है।
OpenClaw डेटा कैसे प्राप्त करता है: स्क्रिप्ट n8n के समाप्त होने की प्रतीक्षा करती है (CapSolver हल + फॉर्म सबमिशन), फिर सीधे वेबहुक प्रतिक्रिया में
{ pageText, savedAt }प्राप्त करती है। कोई फ़ाइल पढ़ना शामिल नहीं है — डेटा HTTP पर समकालिक रूप से वापस आता है। प्रतिक्रिया का आकार वही है जो यह वर्कफ़्लो लौटाता है — यदि आपको अलग-अलग फ़ील्ड की आवश्यकता है (उदा., एक पार्स की गई कीमत, एक लॉगिन स्थिति, एक संरचित JSON ऑब्जेक्ट), तो अपने उपयोग के मामले की आवश्यकता के अनुसार वापस करने के लिए फ़ील्ड संपादित करें और परिणाम सहेजें नोड्स को संशोधित करें।
TOOLS.md में कमांड पंजीकृत करें:
~/.openclaw/workspace/TOOLS.md खोलें और निम्नलिखित प्रविष्टि जोड़ें ताकि OpenClaw को कमांड के बारे में पता चले:
### extract-data
चलाएँ: `/root/.openclaw/scripts/extract-data`
लाइव पाइपलाइन से ताज़ा `{ pageText, savedAt }` लौटाता है। JSON प्रतिक्रिया से `pageText` फ़ील्ड लौटाएँ।
OpenClaw से ट्रिगर करें — इस कमांड को अपने AI एजेंट को भेजें (Discord, Telegram, WhatsApp, या किसी भी चैनल के माध्यम से):
extract data
OpenClaw extract-data स्क्रिप्ट चलाता है, जो वेबहुक को फायर करता है और प्रतीक्षा करता है। n8n CAPTCHA को हल करता है, फॉर्म सबमिट करता है, और सीधे HTTP प्रतिक्रिया में { pageText, savedAt } लौटाता है। OpenClaw परिणाम प्राप्त करता है और सारांशित करता है — आमतौर पर 10-40 सेकंड के भीतर।
टर्मिनल से परीक्षण करें:
curl -s -X POST http://127.0.0.1:3005/webhook/openclaw/scrape
इस मार्गदर्शिका का वर्कफ़्लो एक विशिष्ट डेमो साइट के लिए बनाया गया है। आपके वास्तविक लक्ष्य के लिए, पाइपलाइन के हर हिस्से में समायोजन की आवश्यकता हो सकती है। यहाँ क्या देखना है:
सभी साइटें reCAPTCHA v2 का उपयोग नहीं करती हैं। लक्ष्य जो उपयोग करता है उससे मेल खाने के लिए CapSolver नोड के कार्य प्रकार को बदलें:
| आप साइट पर क्या देखते हैं | n8n नोड ऑपरेशन |
|---|---|
| "मैं रोबोट नहीं हूँ" चेकबॉक्स | reCAPTCHA v2 |
| अदृश्य reCAPTCHA (ऑटो-फायर) | reCAPTCHA v2 |
| reCAPTCHA v3 स्कोर | reCAPTCHA v3 |
| Cloudflare Turnstile विजेट | Cloudflare Turnstile |
| Cloudflare चुनौती (5s पृष्ठ) | Cloudflare Challenge |
| GeeTest पहेली (v3) | GeeTest V3 |
| GeeTest पहेली (v4) | GeeTest V4 |
| DataDome बॉट सुरक्षा | DataDome |
| AWS WAF CAPTCHA | AWS WAF |
| MTCaptcha | MTCaptcha |
अपने लक्ष्य से मेल खाने के लिए वेबसाइट URL और वेबसाइट कुंजी को भी अपडेट करें। आप पृष्ठ स्रोत में साइट कुंजी पा सकते हैं (data-sitekey विशेषता देखें, या CapSolver ब्राउज़र एक्सटेंशन इसका स्वतः पता लगाता है)।
यह वह हिस्सा है जो साइटों के बीच सबसे अधिक भिन्न होता है। डेमो साइट बॉडी फ़ील्ड में टोकन के साथ एक साधारण फॉर्म POST का उपयोग करती है। आपका लक्ष्य अलग हो सकता है:
एक फॉर्म फ़ील्ड के रूप में (सबसे आम)
POST /submit
Content-Type: application/x-www-form-urlencoded
g-recaptcha-response=TOKEN&other_field=value
JSON बॉडी में
POST /api/login
Content-Type: application/json
{ "username": "...", "password": "...", "captchaToken": "TOKEN" }
एक हेडर में
POST /api/action
X-Captcha-Token: TOKEN
एक कुकी के रूप में
POST /submit
Cookie: cf_clearance=TOKEN
URL में क्वेरी पैरामीटर के रूप में
GET /search?q=query&token=TOKEN
जब आप अपनी लक्ष्य साइट पर मैन्युअल रूप से CAPTCHA हल करते हैं तो अपने ब्राउज़र के देव टूल में नेटवर्क टैब का निरीक्षण करें। उस अनुरोध की तलाश करें जो हल होने के तुरंत बाद फायर होता है — जो आपको ठीक से दिखाता है कि टोकन कहाँ जाता है।
एक बार जब आप जान जाते हैं कि टोकन कैसे सबमिट किया जाता है, तो तदनुसार HTTP अनुरोध नोड को कॉन्फ़िगर करें:
वर्कफ़्लो वर्तमान में प्रतिक्रिया के पूर्ण HTML को pageText के रूप में पास करता है। आपके उपयोग के मामले के आधार पर, आप इसे पोस्ट-प्रोसेस करना चाह सकते हैं:
कुछ लक्ष्यों के लिए एक से अधिक अनुरोध की आवश्यकता होती है:
इसे संभालने के लिए n8n में कई HTTP अनुरोध नोड्स को चेन करें। $json अभिव्यक्तियों का उपयोग करके नोड्स के बीच मान पास करें।
{"success": false, "error": "Failed to reach n8n scraper. Is the OpenClaw CAPTCHA Scraper workflow active?"}
जाँचें: क्या n8n चल रहा है? क्या वर्कफ़्लो सक्रिय है? n8n खोलें और सत्यापित करें कि वर्कफ़्लो सक्रिय है (हरा टॉगल)।
संभावित कारण:
~/.n8n/credentials जाँचेंpageText खाली है या इसमें एक त्रुटि पृष्ठ हैg-recaptcha-response फ़ील्ड नाम की जाँच करें — कुछ साइटें एक अलग फ़ील्ड नाम का उपयोग करती हैंfullResponse: true सक्षम करें| नोड | प्रकार | कुंजी कॉन्फ़िगरेशन |
|---|---|---|
| वेबहुक | n8n-nodes-base.webhook |
POST, पथ: openclaw/scrape, responseMode: responseNode |
| साइट स्क्रैप करें | n8n-nodes-capsolver.capSolver |
कार्य: ReCaptchaV2TaskProxyless |
| HTTP अनुरोध | n8n-nodes-base.httpRequest |
बॉडी में टोकन के साथ लक्ष्य URL पर POST करें |
| यदि | n8n-nodes-base.if |
जाँचें कि $json.data में "recaptcha-success" शामिल है |
| फ़ील्ड संपादित करें | n8n-nodes-base.set |
pageText = $json.data |
| परिणाम सहेजें | n8n-nodes-base.executeCommand या कोई भी स्टोरेज नोड |
परिणाम बनाए रखें (फ़ाइल, DB, शीट्स, आदि) |
| वेबहुक का जवाब दें | n8n-nodes-base.respondToWebhook |
JSON, continueOnFail: true |
| CAPTCHA | n8n नोड ऑपरेशन |
|---|---|
| reCAPTCHA v2 (चेकबॉक्स) | reCAPTCHA v2 |
| reCAPTCHA v2 (अदृश्य) | reCAPTCHA v2 |
| reCAPTCHA v3 | reCAPTCHA v3 |
| Cloudflare Turnstile | Cloudflare Turnstile |
| Cloudflare चुनौती | Cloudflare Challenge |
| GeeTest V3 | GeeTest V3 |
| GeeTest V4 | GeeTest V4 |
| DataDome | DataDome |
| AWS WAF | AWS WAF |
| MTCaptcha | MTCaptcha |
OpenClaw + n8n + CapSolver पाइपलाइन एक उत्पादन-ग्रेड डेटा निष्कर्षण सेटअप प्रदान करती है जो:
AI एजेंट बस एक "extract data" कमांड जारी करता है और स्वच्छ पृष्ठ सामग्री प्राप्त करता है। CapSolver कठिन भाग को संभालता है, n8n प्रवाह को व्यवस्थित करता है, और OpenClaw इंटरफ़ेस के रूप में कार्य करता है।
आरंभ करने के लिए तैयार हैं? CapSolver के लिए साइन अप करें और अपने पहले रिचार्ज पर अतिरिक्त 6% बोनस के लिए बोनस कोड OPENCLAW का उपयोग करें!
नहीं। OpenClaw बस एक स्क्रिप्ट चलाता है जो HTTP अनुरोध को फायर करता है। n8n बाकी सब कुछ संभालता है। आपके AI एजेंट को CAPTCHA का कोई ज्ञान नहीं है — यह केवल एक कार्य को ट्रिगर करता है और परिणाम पढ़ता है।
हाँ, लेकिन आपको केवल URL से अधिक समायोजित करने की आवश्यकता होगी। प्रत्येक साइट CAPTCHA टोकन को अलग तरह से सबमिट करती है — कुछ फॉर्म फ़ील्ड का उपयोग करते हैं, कुछ JSON बॉडी, कुछ हेडर या कुकीज़। क्या जाँचना और बदलना है, इसके पूर्ण विवरण के लिए ऊपर "वर्कफ़्लो को अपनी लक्ष्य साइट के अनुकूल बनाना" अनुभाग देखें।
CapSolver नोड के कार्य प्रकार को AntiTurnstileTaskProxyless में बदलें। फिर यह पता लगाने के लिए अपने लक्ष्य के नेटवर्क अनुरोधों का निरीक्षण करें कि Turnstile टोकन कहाँ सबमिट किया गया है — यह अक्सर cf-turnstile-response नामक एक छिपे हुए फॉर्म फ़ील्ड में होता है, लेकिन कुछ कार्यान्वयन इसे JSON बॉडी, हेडर या कुकी में पास करते हैं।
यह आपके संग्रहण विकल्प पर निर्भर करता है। स्थानीय JSON फ़ाइल के साथ, आप जितने चाहें उतने रख सकते हैं। Google Sheets या डेटाबेस के साथ, प्रत्येक रन अनिश्चित काल तक एक पंक्ति जोड़ता है। अपनी प्रतिधारण आवश्यकताओं से मेल खाने के लिए परिणाम सहेजें नोड को कॉन्फ़िगर करें।
हाँ — वेबहुक समापन बिंदु केवल एक HTTP POST है। कोई भी चीज़ जो HTTP अनुरोध कर सकती है, उसे ट्रिगर कर सकती है:
curl -s -X POST http://127.0.0.1:3005/webhook/openclaw/scrape
प्रत्येक रन में CAPTCHA हल करने के लिए एक CapSolver क्रेडिट खर्च होता है। reCAPTCHA v2 सबसे सस्ते प्रकारों में से एक है। capsolver.com पर वर्तमान मूल्य निर्धारण की जाँच करें।
OpenClaw ओपन-सोर्स है और सेल्फ-होस्ट करने के लिए मुफ़्त है। आपको अपने AI मॉडल प्रदाता के लिए API क्रेडिट और CAPTCHA हल करने के लिए CapSolver की आवश्यकता होगी।
CapSolver और n8n का उपयोग करके eCAPTCHA v2/v3 सॉल्वर API बनाएं। बिना कोडिंग के टोकन को ऑटोमेट करने, वेबसाइट पर सबमिट करने और सुरक्षित डेटा निकालने का तरीका सीखें।

CapSolver और n8n का उपयोग करके Cloudflare Turnstile को हल करने के लिए एक API बनाएं। सीखें कि टोकन सॉल्विंग को कैसे ऑटोमेट करें, उसे वेबसाइट पर सबमिट करें, और बिना कोडिंग के संरक्षित डेटा निकालें।
