
Anh Tuan
Data Science Expert

Khi trợ lý AI của bạn duyệt web thay bạn, CAPTCHA là chướng ngại vật số một. Các trang được bảo vệ chặn trợ lý, các biểu mẫu không thể được gửi, và các nhiệm vụ bị treo chờ can thiệp từ người dùng.
OpenClaw là trợ lý AI cá nhân có thể duyệt web, điền biểu mẫu, nhấp nút và trích xuất dữ liệu — tất cả thông qua ngôn ngữ tự nhiên. Tuy nhiên, giống như bất kỳ tự động hóa trình duyệt nào, nó bị chặn bởi CAPTCHA.
CapSolver thay đổi hoàn toàn điều này. Bằng cách tải tiện ích mở rộng CapSolver Chrome vào trình duyệt của OpenClaw, CAPTCHA được giải tự động và không thấy ở nền. Không cần code. Không cần gọi API từ phía bạn. Không cần thay đổi cách bạn giao tiếp với trợ lý AI của mình.
Điều tuyệt nhất? Bạn thậm chí không cần đề cập đến CAPTCHA với AI. Bạn chỉ cần bảo nó đợi một lúc trước khi gửi — và đến lúc nó nhấp vào "Gửi", CAPTCHA đã được giải.
OpenClaw là trợ lý AI cá nhân bạn chạy trên thiết bị của mình. Nó trả lời bạn trên các kênh bạn đã sử dụng — WhatsApp, Telegram, Slack, Discord, Signal, iMessage, Google Chat, Microsoft Teams, và nhiều hơn nữa.

OpenClaw chạy một profile trình duyệt Chromium riêng biệt chỉ có trợ lý AI điều khiển. Nó hoàn toàn tách biệt khỏi trình duyệt cá nhân của bạn. Trợ lý có thể:
Hình dung như bạn đang cấp cho trợ lý AI của mình một cửa sổ trình duyệt riêng.
CapSolver là dịch vụ giải CAPTCHA hàng đầu cung cấp giải pháp dựa trên AI để vượt qua các thách thức CAPTCHA khác nhau. Với hỗ trợ cho nhiều loại CAPTCHA và thời gian phản hồi nhanh, CapSolver tích hợp liền mạch vào các quy trình tự động hóa.
Hầu hết các tích hợp giải CAPTCHA yêu cầu bạn viết code — tạo gọi API, kiểm tra kết quả, chèn token vào các trường ẩn. Đó là cách hoạt động với các công cụ như Crawlee, Puppeteer, hoặc Playwright.
OpenClaw + CapSolver hoàn toàn khác biệt:
| Truyền thống (dựa trên code) | OpenClaw (ngôn ngữ tự nhiên) |
|---|---|
Viết lớp CapSolverService |
Thêm đường dẫn tiện ích mở rộng vào cấu hình |
Gọi createTask() / getTaskResult() |
Chỉ cần trò chuyện với AI của bạn |
Chèn token qua page.$eval() |
Tiện ích mở rộng xử lý mọi thứ |
| Xử lý lỗi, thử lại, thời gian chờ trong code | Nói với AI để "đợi 60 giây, sau đó gửi" |
| Code khác nhau cho mỗi loại CAPTCHA | Hoạt động cho tất cả các loại tự động |
Điểm mấu chốt: Tiện ích mở rộng CapSolver chạy trong phiên trình duyệt của trợ lý. Khi trợ lý điều hướng đến trang có CAPTCHA, tiện ích mở rộng phát hiện nó, giải nó ở nền, và chèn token — tất cả trước khi trợ lý thậm chí cố gắng gửi biểu mẫu.
Bạn chỉ cần cho nó thời gian. Thay vì nói với AI "giải CAPTCHA", bạn chỉ cần nói:
"Đi đến trang đó, đợi 60 giây, sau đó nhấp vào Gửi."
Đó là tất cả. AI không cần biết về CapSolver.
Trước khi thiết lập tích hợp, hãy đảm bảo bạn có:
Google Chrome 137+ (phát hành giữa năm 2025) đã ngầm loại bỏ hỗ trợ cho
--load-extensiontrong các phiên bản thương mại. Điều này có nghĩa là tiện ích mở rộng Chrome không thể được tải trong các phiên tự động hóa sử dụng Chrome tiêu chuẩn. Không có thông báo lỗi — cờ chỉ bị bỏ qua.
Điều này ảnh hưởng đến Google Chrome và Microsoft Edge. Bạn phải sử dụng một trong các lựa chọn sau:
| Trình duyệt | Tải tiện ích mở rộng | Được khuyến khích? |
|---|---|---|
| Google Chrome 137+ | Không hỗ trợ | Không |
| Microsoft Edge | Không hỗ trợ | Không |
| Chrome cho kiểm thử | Hỗ trợ | Có |
| Chromium (độc lập) | Hỗ trợ | Có |
| Chromium tích hợp trong Playwright | Hỗ trợ | Có |
Cách cài đặt Chrome cho kiểm thử:
# Phương án 1: Qua Playwright (được khuyến khích)
npx playwright install chromium
# Đường dẫn nhịp sẽ là:
# ~/.cache/ms-playwright/chromium-XXXX/chrome-linux64/chrome (Linux)
# ~/Library/Caches/ms-playwright/chromium-XXXX/chrome-mac/Chromium.app/Contents/MacOS/Chromium (macOS)
# Phương án 2: Tải trực tiếp Chrome cho kiểm thử
# Truy cập: https://googlechromelabs.github.io/chrome-for-testing/
# Tải phiên bản tương thích với hệ điều hành của bạn
Sau khi cài đặt, ghi nhớ đường dẫn đầy đủ đến tệp nhịp — bạn sẽ cần nó cho cấu hình.
Tải xuống tiện ích mở rộng CapSolver Chrome và giải nén nó vào ~/.openclaw/capsolver-extension/:
CapSolver.Browser.Extension-chrome-vX.X.X.zipmkdir -p ~/.openclaw/capsolver-extension
unzip CapSolver.Browser.Extension-chrome-v*.zip -d ~/.openclaw/capsolver-extension/
ls ~/.openclaw/capsolver-extension/manifest.json
Bạn nên thấy manifest.json — điều này xác nhận tiện ích mở rộng ở đúng vị trí.
Mở tệp cấu hình tiện ích mở rộng tại ~/.openclaw/capsolver-extension/assets/config.js và thay giá trị apiKey bằng khóa của bạn:
export const defaultConfig = {
apiKey: 'CAP-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX', // ← khóa của bạn ở đây
useCapsolver: true,
// ... phần còn lại của cấu hình
};
Bạn có thể lấy khóa API từ bảng điều khiển CapSolver.
Chỉnh sửa tệp cấu hình OpenClaw tại ~/.openclaw/openclaw.json để kích hoạt trình duyệt và tải tiện ích mở rộng:
{
"browser": {
"enabled": true,
"executablePath": "/path/to/chrome-for-testing/chrome",
"extensions": [
"~/.openclaw/capsolver-extension"
],
"noSandbox": true,
"defaultProfile": "openclaw"
}
}
Thay thế /path/to/chrome-for-testing/chrome bằng đường dẫn thực tế đến tệp nhịp Chrome cho kiểm thử hoặc Chromium. Ví dụ:
~/.cache/ms-playwright/chromium-1200/chrome-linux64/chrome~/Library/Caches/ms-playwright/chromium-1200/chrome-mac/Chromium.app/Contents/MacOS/ChromiumLưu ý:
noSandbox: truelà bắt buộc trên hầu hết các môi trường máy chủ, Docker, và hệ thống CI nơi sandbox Chrome không thể khởi động. Trên các hệ thống máy tính để bàn với sandboxing đúng, bạn có thể bỏ qua.
# Nếu sử dụng PM2:
pm2 restart opencrawl --update-env
# Nếu chạy trực tiếp:
openclaw gateway restart
Kiểm tra nhật ký cổng kết nối để xác nhận mọi thứ đã được tải đúng:
pm2 logs opencrawl --lines 20 --nostream
Bạn nên thấy các dòng quan trọng sau:
[browser/chrome] Đang tải 1 tiện ích mở rộng(s)
[browser/chrome] Đang khởi động Chrome: /path/to/chrome-for-testing (các tham số: 15)
Kiểm tra nâng cao — xác minh tiện ích mở rộng đang hoạt động qua Chrome DevTools Protocol:
curl -s http://127.0.0.1:8091/json/list
Tìm một mục service_worker với chrome-extension:// trong URL:
{
"title": "Service Worker chrome-extension://cnopfoopenkdblckmekkipihdnambjhf/background.js",
"type": "service_worker",
"url": "chrome-extension://cnopfoopenkdblckmekkipihdnambjhf/background.js"
}
Nếu bạn thấy điều này, CapSolver đã được tải và đang chạy.

Đây là phần quan trọng nhất. Sau khi cài đặt xong, sử dụng CapSolver với OpenClaw là rất đơn giản.
Không đề cập đến CAPTCHA hoặc CapSolver với AI. Chỉ cần cho nó thời gian trước khi gửi biểu mẫu.
Trợ lý AI không cần biết về CAPTCHA. Tiện ích mở rộng xử lý mọi thứ ở nền. Tất cả bạn cần làm là bao gồm một thời gian chờ trong chỉ dẫn để tiện ích mở rộng có thời gian giải bài toán trước khi biểu mẫu được gửi.
Gửi điều này đến trợ lý OpenClaw của bạn (qua Discord, WhatsApp, Telegram, hoặc bất kỳ kênh nào):
Đi đến https://example.com, đợi 60 giây,
sau đó nhấp vào Gửi và cho tôi biết văn bản nào xuất hiện trên trang.
Điều gì xảy ra phía sau:
Đi đến https://example.com/login, điền trường email với
"me@example.com" và trường mật khẩu với "mypassword123",
sau đó đợi 30 giây và nhấp nút Đăng nhập. Cho tôi biết trang nào tải sau khi đăng nhập.
Mở https://example.com/contact, điền biểu mẫu liên hệ:
- Tên: "John Doe"
- Email: "john@example.com"
- Tin nhắn: "Xin chào, tôi có câu hỏi về dịch vụ của bạn."
Đợi 45 giây, sau đó nhấp vào Gửi Tin nhắn. Thông báo nào xuất hiện?
| Loại CAPTCHA | Thời gian giải trung bình | Thời gian chờ được đề xuất |
|---|---|---|
| reCAPTCHA v2 (nút bấm) | 5-15 giây | 30-60 giây |
| reCAPTCHA v2 (ẩn) | 5-15 giây | 30 giây |
| reCAPTCHA v3 | 3-10 giây | 20-30 giây |
| Cloudflare Turnstile | 3-10 giây | 20-30 giây |
Lưu ý: Khi không chắc, hãy dùng 60 giây. Tốt hơn là đợi lâu hơn một chút thay vì gửi quá sớm. Thời gian chờ thêm không ảnh hưởng đến kết quả.
Dưới đây là các cách diễn đạt đã được kiểm chứng bạn có thể sử dụng:
Tránh những điều này — chúng có thể làm trợ lý AI bối rối hoặc gây từ chối:
Đối với những người quan tâm đến kỹ thuật, đây là điều xảy ra khi tiện ích mở rộng CapSolver được tải:
Tin nhắn của bạn Cổng kết nối OpenClaw
───────────────────────────────────────────────────
"đi đến trang, ──► Trợ lý AI nhận được tin nhắn
đợi 60s, gửi" │
▼
Công cụ Trình duyệt: điều hướng đến URL
│
▼
Chromium tải trang
┌─────────────────────────────┐
│ Trang có widget reCAPTCHA │
│ │
│ Tiện ích mở rộng CapSolver: │
│ 1. Script nội dung phát hiện │
│ reCAPTCHA trên trang │
│ 2. Service worker gọi │
│ API CapSolver │
│ 3. Token nhận được │
│ 4. Token chèn vào │
│ trường ẩn trong biểu mẫu │
└─────────────────────────────┘
│
▼
Trợ lý AI đợi 60 giây...
│
▼
Công cụ Trình duyệt: nhấp vào Gửi
│
▼
Biểu mẫu được gửi với token hợp lệ
│
▼
"Xác minh thành công!"
Khi trình duyệt của OpenClaw khởi động, nó đọc danh sách extensions từ cấu hình và truyền mỗi đường dẫn đến Chrome qua cờ --load-extension. Đây là cơ chế mà Chrome sử dụng cho các tiện ích mở rộng của nhà phát triển — không cần hệ thống plugin đặc biệt.
--load-extension=~/.openclaw/capsolver-extensionDưới đây là cấu hình ~/.openclaw/openclaw.json đầy đủ với tiện ích mở rộng CapSolver:
{
"browser": {
"enabled": true,
"executablePath": "/path/to/chrome-for-testing/chrome",
"extensions": [
"~/.openclaw/capsolver-extension"
],
"noSandbox": true,
"defaultProfile": "openclaw"
}
}
| Tùy chọn | Mô tả |
|---|---|
browser.executablePath |
Đường dẫn đến tệp nhị phân Chrome for Testing hoặc Chromium (bắt buộc) |
browser.extensions |
Mảng các đường dẫn thư mục mở rộng để tải vào Chrome |
browser.noSandbox |
Thiết lập thành true trên máy chủ/Docker (khu vực cách ly Chrome yêu cầu khả năng kernel đặc biệt) |
browser.defaultProfile |
Tên hồ sơ trình duyệt (mặc định: "chrome") |
Mã API CapSolver được cấu hình trực tiếp trong tệp assets/config.js của mở rộng (xem Bước 2 ở trên).
Triệu chứng: Các bản ghi Gateway hiển thị Loading 1 extension(s) nhưng không có mục tiêu chrome-extension:// nào xuất hiện trong CDP.
Nguyên nhân: Bạn đang sử dụng Chrome chính hãng 137+ sẽ bỏ qua tùy chọn --load-extension một cách im lặng.
Giải pháp: Chuyển sang Chrome for Testing hoặc Chromium. Cập nhật browser.executablePath trong tệp cấu hình của bạn để trỏ đến tệp nhị phân đúng.
Kiểm tra phiên bản Chrome của bạn:
/path/to/your/chrome --version
# Chrome for Testing: "Chromium 143.0.7499.4"
# Chrome chính hãng: "Google Chrome 143.0.7499.109"
Nguyên nhân có thể:
Triệu chứng: Hành động trình duyệt đầu tiên sau khi khởi động lại gateway bị thời gian chờ, nhưng các hành động tiếp theo hoạt động.
Nguyên nhân: Khởi động lạnh của Chromium + thử kết nối CDP của Playwright có thể vượt quá thời gian chờ 20 giây trên lần đầu tiên.
Giải pháp: Đây là sự cố đã biết. Chỉ cần thử lại lệnh — lần thử thứ hai sẽ thành công vì trình duyệt đã "ấm" rồi.
Triệu chứng: Sau khi chuyển từ Chrome chính hãng sang Chrome for Testing, trình duyệt bị treo với lỗi cache đĩa.
Nguyên nhân: Thư mục dữ liệu người dùng được tạo bởi phiên bản Chrome khác và không tương thích.
Giải pháp: Xóa hồ sơ trình duyệt cũ và khởi động lại:
rm -rf ~/.openclaw/browser/openclaw/user-data
# Sau đó khởi động lại gateway
Thời gian chờ dài hơn luôn an toàn hơn. CAPTCHA thường được giải trong 5-20 giây, nhưng độ trễ mạng, thử thách phức tạp hoặc thử lại có thể làm tăng thời gian. 30-60 giây là khoảng thời gian lý tưởng.
Thay vì:
"Đi đến URL, chờ giải CAPTCHA, sau đó gửi"
Sử dụng:
"Đi đến URL, chờ khoảng một phút, sau đó gửi biểu mẫu"
Ngôn ngữ tự nhiên hoạt động tốt hơn với AI và tránh kích hoạt từ chối an toàn.
Mỗi lần giải CAPTCHA tốn phí. Kiểm tra số dư của bạn tại capsolver.com/dashboard thường xuyên để tránh gián đoạn.
noSandbox trên máy chủKhi chạy OpenClaw trên máy chủ từ xa, Docker hoặc môi trường CI, luôn đặt noSandbox: true trong cấu hình trình duyệt của bạn. Khu vực cách ly Chrome yêu cầu các khả năng kernel đặc biệt không có sẵn trong hầu hết các môi trường máy chủ.
DISPLAY cho máy chủ không giao diệnMở rộng Chrome yêu cầu màn hình, ngay cả trên máy chủ không giao diện. Sử dụng Xvfb để tạo màn hình ảo:
# Cài đặt Xvfb
sudo apt-get install xvfb
# Khởi động màn hình ảo
Xvfb :99 -screen 0 1280x720x24 &
# Thiết lập DISPLAY cho OpenClaw
export DISPLAY=:99
Tích hợp OpenClaw + CapSolver đại diện cho cách tiếp cận hoàn toàn mới để giải CAPTCHA. Thay vì viết mã để phát hiện CAPTCHA, gọi API và chèn token, bạn chỉ cần:
Mở rộng CapSolver sẽ xử lý mọi thứ còn lại — phát hiện CAPTCHA, giải chúng qua API CapSolver và chèn token vào trang. Trợ lý AI của bạn không bao giờ cần biết về CAPTCHA.
Đây chính là cách giải CAPTCHA khi bạn có trợ lý AI: bất khả kiến, tự động và không cần lập trình.
Sẵn sàng bắt đầu chưa? Đăng ký CapSolver và sử dụng mã khuyến mãi OPENCLAW để nhận thêm 6% tiền thưởng cho lần nạp đầu tiên!
Không. Thực tế, bạn nên tránh đề cập đến CAPTCHA hoặc CapSolver trong các thông điệp của mình. Mở rộng hoạt động ẩn trong nền. Chỉ cần thêm thời gian chờ trong hướng dẫn của bạn (ví dụ: "chờ 60 giây, sau đó gửi") để mở rộng có thời gian giải CAPTCHA trên trang.
Chrome 137+ (phát hành giữa năm 2025) đã xóa bỏ hỗ trợ cho cờ dòng lệnh --load-extension trong các phiên bản chính hãng. Điều này có nghĩa là mở rộng Chrome không thể được tải trong các phiên bản tự động. Bạn cần Chrome for Testing hoặc Chromium độc lập, vẫn hỗ trợ cờ này.
CapSolver hỗ trợ reCAPTCHA v2 (hộp kiểm và không hiển thị), reCAPTCHA v3, Cloudflare Turnstile, AWS WAF CAPTCHA và nhiều loại khác. Mở rộng Chrome tự động phát hiện loại CAPTCHA và giải nó tương ứng.
CapSolver cung cấp giá cả cạnh tranh dựa trên loại CAPTCHA và khối lượng. Truy cập capsolver.com để xem giá cả hiện tại.
OpenClaw là phần mềm mã nguồn mở và miễn phí để chạy trên thiết bị của bạn. Bạn sẽ cần khóa API cho nhà cung cấp mô hình AI bạn chọn và, để giải CAPTCHA, một tài khoản CapSolver với số dư.
Đối với hầu hết CAPTCHA, 30-60 giây là đủ. Thời gian giải thực tế thường là 5-20 giây, nhưng thêm thời gian dự phòng đảm bảo độ tin cậy. Nếu không chắc, hãy sử dụng 60 giây.
Có. Bạn sẽ cần Xvfb (X Virtual Framebuffer) cho màn hình vì mở rộng Chrome yêu cầu ngữ cảnh màn hình. Thiết lập DISPLAY=:99 và chạy Xvfb :99 ở nền. Cũng thiết lập noSandbox: true trong cấu hình trình duyệt của bạn.
Khám phá cách cơ sở hạ tầng tự động hóa AI được cung cấp bởi Mô hình Ngôn ngữ lớn (LLM) đột phá trong việc nhận diện CAPTCHA, nâng cao hiệu quả quy trình kinh doanh và giảm thiểu sự can thiệp thủ công. Tối ưu hóa các quy trình tự động của bạn với các giải pháp xác minh tiên tiến.

Hãy học cách mở rộng thu thập dữ liệu cho việc huấn luyện mô hình LLM bằng cách giải CAPTCHAs quy mô lớn. Khám phá các chiến lược tự động để xây dựng các bộ dữ liệu chất lượng cao cho các mô hình AI.
