CAPSOLVER
Blog
Cách giải CAPTCHA trong OpenBrowser sử dụng CapSolver (Hướng dẫn tự động hóa AI Agent)

Làm thế nào để giải CAPTCHA trong OpenBrowser bằng cách sử dụng CapSolver (Hướng dẫn tự động hóa AI Agent)

Logo of CapSolver

Anh Tuan

Data Science Expert

26-Mar-2026

Các đại diện duyệt web được cấp bằng AI đang thay đổi cách chúng ta tương tác với internet. Chúng có thể điều hướng trang web, điền biểu mẫu, trích xuất dữ liệu và hoàn thành các quy trình nhiều bước - tất cả chỉ từ một chỉ định văn bản đơn giản. Nhưng có một rào cản khiến mọi đại diện dừng lại: CAPTCHA.

OpenBrowser là một khung phần mềm duyệt web tự động cung cấp quyền kiểm soát trực tiếp trình duyệt thực sự cho các mô hình AI như GPT-4o, Claude và Gemini. Nó mạnh mẽ, nhưng ngay khi nó gặp trang web được bảo vệ bằng CAPTCHA, đại diện sẽ dừng lại.

CapSolver loại bỏ hoàn toàn vấn đề này. Bằng cách tải tiện ích mở rộng CapSolver vào hồ sơ khởi động của OpenBrowser, CAPTCHA sẽ được phát hiện và giải tự động ở nền - không cần lập trình API, không cần mã chèn token, không cần thay đổi logic đại diện của bạn.

Điều tuyệt nhất? Đại diện AI của bạn không bao giờ cần biết đến sự tồn tại của CAPTCHA. Tiện ích mở rộng xử lý phát hiện, giải và chèn token ở cấp độ trình duyệt. Khi đại diện nhấp vào Nút Gửi, CAPTCHA đã được giải rồi.


OpenBrowser là gì?

OpenBrowser là một khung phần mềm duyệt web tự động cho AI được xây dựng bằng TypeScript và Playwright. Nó mang lại quyền kiểm soát bị cách ly trực tiếp của một trình duyệt Chromium thực sự cho các mô hình ngôn ngữ lớn - biến bất kỳ LLM nào thành một đại diện có khả năng duyệt web.

Tính năng chính

  • Hỗ trợ đa mô hình: Hoạt động với GPT-4o của OpenAI, Claude của Anthropic và Gemini của Google ngay từ đầu
  • REPL tương tác: Trò chuyện với đại diện trình duyệt của bạn theo thời gian thực từ terminal
  • Thực thi bị cách ly: Mỗi phiên duyệt web chạy trong một ngữ cảnh Playwright tách biệt để đảm bảo an toàn
  • Theo dõi chi phí: Theo dõi token và chi phí tích hợp để bạn biết chính xác chi phí cho mỗi nhiệm vụ
  • Bộ xây dựng LaunchProfile: API dễ sử dụng để cấu hình các tùy chọn khởi động trình duyệt, tiện ích mở rộng, chế độ ẩn và nhiều hơn nữa
  • Chế độ ẩn: Tránh nhận diện dấu vân tay tích hợp để giảm phát hiện bot

Khoảng trống trình duyệt

OpenBrowser trao cho các mô hình AI mắt và tay trên web. Nhưng CAPTCHA vẫn là một điểm mù. Đại diện có thể nhìn thấy trang, đọc các trường biểu mẫu và nhấp vào nút - nhưng nó không thể giải quyết một thách thức reCAPTCHA hoặc một widget Turnstile. Đó là nơi CapSolver xuất hiện.


CapSolver là gì?

CapSolver là dịch vụ giải CAPTCHA hàng đầu cung cấp các giải pháp được cấp bằng AI để vượt qua các thách thức CAPTCHA khác nhau. Với sự hỗ trợ cho nhiều loại CAPTCHA và thời gian phản hồi nhanh, CapSolver tích hợp mượt mà vào các quy trình tự động hóa.

Các loại CAPTCHA được hỗ trợ


Tại sao tích hợp này khác biệt?

Hầu hết các tích hợp giải CAPTCHA yêu cầu bạn viết mã - tạo các cuộc gọi API, kiểm tra kết quả, chèn token vào các trường biểu mẫu ẩn. Đó là cách hoạt động với các công cụ như Crawlee, Puppeteer hoặc Playwright.

OpenBrowser + CapSolver hoàn toàn khác biệt:

Truyền thống (dựa trên mã) OpenBrowser (dựa trên tiện ích mở rộng)
Viết lớp CapSolverService Thêm tiện ích mở rộng cộng với một tham số cho phép Chrome rõ ràng
Gọi createTask() / getTaskResult() Tiện ích mở rộng xử lý toàn bộ chuỗi cuộc sống
Chèn token thông qua page.$eval() Token được chèn tự động ở cấp độ trình duyệt
Xử lý lỗi, thử lại, thời gian chờ trong mã Tiện ích mở rộng thử lại bên trong
Mã khác nhau cho mỗi loại CAPTCHA Hoạt động cho tất cả các loại tự động
Liên kết chặt chẽ với logic đại diện của bạn Không liên kết - đại diện không biết đến CAPTCHA

Thông tin chính: Tiện ích mở rộng CapSolver chạy bên trong ngữ cảnh trình duyệt Playwright của OpenBrowser. Khi đại diện điều hướng đến trang có CAPTCHA, tiện ích mở rộng phát hiện nó, giải nó ở nền, và chèn token - tất cả trước khi đại diện cố gắng gửi biểu mẫu.

Bạn chỉ cần cho nó thời gian. Thay vì viết mã xử lý CAPTCHA, bạn thêm một khoảng chờ ngắn vào luồng đại diện của mình:

typescript Copy
// Đại diện chờ, sau đó gửi - CapSolver xử lý phần còn lại
await page.waitForTimeout(30_000);
await page.click('button[type="submit"]');

Đó là tất cả. Không có logic CAPTCHA. Không có cuộc gọi API. Không có chèn token.


Yêu cầu tiên quyết

Trước khi thiết lập tích hợp, hãy đảm bảo bạn có:

  1. OpenBrowser được cài đặt (npm install openbrowser hoặc sao chép từ GitHub)
  2. Tài khoản CapSolver với khóa API (đăng ký tại đây)
  3. Node.js 18+TypeScript được cấu hình
  4. Chromium hoặc Chrome cho kiểm thử (xem lưu ý quan trọng bên dưới)

Lưu ý quan trọng: Bạn cần Chromium, không phải Google Chrome

Google Chrome 137+ (phát hành giữa năm 2025) đã ngầm loại bỏ hỗ trợ cho --load-extension trong các bản dựng thương mại. Điều này có nghĩa là tiện ích mở rộng Chrome không thể được tải trong các phiên tự động hóa sử dụng Chrome tiêu chuẩn. Không có lỗi - cờ được bỏ qua.

Điều này ảnh hưởng đến Google Chrome và Microsoft Edge. Bạn phải sử dụng một trong những lựa chọn sau:

Trình duyệt Tải tiện ích mở rộng Được khuyến nghị?
Google Chrome 137+ Không hỗ trợ Không
Microsoft Edge Không hỗ trợ Không
Chrome cho kiểm thử Hỗ trợ
Chromium (độc lập) Hỗ trợ
Chromium được đóng gói bởi Playwright Hỗ trợ

Cách cài đặt Chrome cho kiểm thử:

bash Copy
# Phương pháp 1: Qua Playwright (được khuyến nghị - OpenBrowser đã sử dụng Playwright)
npx playwright install chromium

# Đường dẫn nhị phân sẽ là:
# ~/.cache/ms-playwright/chromium-XXXX/chrome-linux64/chrome  (Linux)
# ~/Library/Caches/ms-playwright/chromium-XXXX/chrome-mac/Chromium.app/Contents/MacOS/Chromium  (macOS)
bash Copy
# Phương pháp 2: Tải trực tiếp từ Chrome cho kiểm thử
# Truy cập: https://googlechromelabs.github.io/chrome-for-testing/
# Tải phiên bản phù hợp với hệ điều hành của bạn

Sau khi cài đặt, ghi chú đường dẫn đầy đủ đến tệp nhị phân - bạn sẽ cần nó cho hồ sơ khởi động.


Hướng dẫn cài đặt từng bước

Bước 1: Cài đặt OpenBrowser

Nếu bạn chưa cài đặt, hãy cài đặt OpenBrowser:

bash Copy
npm install openbrowser

Hoặc sao chép kho lưu trữ để có các tính năng mới nhất:

bash Copy
git clone https://github.com/ntegrals/openbrowser.git
cd openbrowser
npm install

Bước 2: Tải tiện ích mở rộng CapSolver cho Chrome

Tải tiện ích mở rộng CapSolver và giải nén nó vào một thư mục đã biết:

  1. Truy cập các phiên bản tiện ích mở rộng CapSolver trên GitHub
  2. Tải xuống phiên bản CapSolver.Browser.Extension-chrome-vX.X.X.zip mới nhất
  3. Giải nén zip:
bash Copy
mkdir -p ~/.openbrowser/capsolver-extension
unzip CapSolver.Browser.Extension-chrome-v*.zip -d ~/.openbrowser/capsolver-extension/
  1. Xác minh việc giải nén thành công:
bash Copy
ls ~/.openbrowser/capsolver-extension/manifest.json

Bạn nên thấy manifest.json - điều này xác nhận tiện ích mở rộng ở đúng vị trí.

Bước 3: Thiết lập khóa API CapSolver của bạn

Mở tệp cấu hình tiện ích mở rộng tại ~/.openbrowser/capsolver-extension/assets/config.js và thay giá trị apiKey bằng khóa của bạn:

js Copy
export const defaultConfig = {
  apiKey: 'CAP-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX',  // đặt khóa của bạn ở đây
  useCapsolver: true,
  // ... phần còn lại của cấu hình
};

Bạn có thể lấy khóa API từ bảng điều khiển CapSolver.

Bước 4: Cấu hình LaunchProfile của bạn

Đây là nơi OpenBrowser tỏa sáng. Sử dụng bộ xây dựng LaunchProfile để tải tiện ích mở rộng CapSolver vào trình duyệt:

typescript Copy
import { LaunchProfile, OpenBrowser } from 'openbrowser';

const profile = new LaunchProfile()
  .addExtension('/home/user/.openbrowser/capsolver-extension')
  .extraArgs('--disable-extensions-except=/home/user/.openbrowser/capsolver-extension')
  .headless(false)    // Bắt buộc - các tiện ích mở rộng MV3 cần trình duyệt có đầu
  .stealthMode();     // Giảm dấu vân tay phát hiện bot

Tại sao headless(false)? Các tiện ích mở rộng MV3 (Manifest V3) của Chrome, bao gồm CapSolver, yêu cầu một môi trường trình duyệt có đầu. Dịch vụ worker điều khiển tiện ích mở rộng không tải trong chế độ headless. Trên máy chủ không có màn hình, hãy sử dụng Xvfb (xem Bước 7).

Lưu ý quan trọng: Nếu bạn truyền các cờ Chrome tùy chỉnh ở bất kỳ đâu trong thiết lập của bạn, hãy không bao gồm --disable-background-networking. Dịch vụ worker của tiện ích mở rộng CapSolver cần truy cập mạng ra ngoài.

Bước 5: Khởi động trình duyệt và chạy đại diện của bạn

typescript Copy
import { LaunchProfile, OpenBrowser } from 'openbrowser';

const profile = new LaunchProfile()
  .addExtension('/home/user/.openbrowser/capsolver-extension')
  .extraArgs('--disable-extensions-except=/home/user/.openbrowser/capsolver-extension')
  .headless(false)
  .stealthMode();

const browser = await OpenBrowser.launch(profile);

// Điều hướng đến trang được bảo vệ bằng CAPTCHA
await browser.goto('https://example.com/protected-form');

// Chờ CapSolver phát hiện và giải CAPTCHA
await browser.page.waitForTimeout(30_000);

// Gửi biểu mẫu - token CAPTCHA đã được chèn
await browser.page.click('button[type="submit"]');

// Đọc trang đích hoặc phần tử xác nhận
const result = await browser.page.textContent('body');
console.log(result); // ví dụ: văn bản xác nhận mà trang trả về

await browser.close();

Bước 6: Sử dụng với các đại diện AI

Sức mạnh thực sự của OpenBrowser là cho phép mô hình AI kiểm soát trình duyệt. Đây là cách kết nối nó với CapSolver:

typescript Copy
import { LaunchProfile, OpenBrowser, Agent } from 'openbrowser';

const profile = new LaunchProfile()
  .addExtension('/home/user/.openbrowser/capsolver-extension')
  .extraArgs('--disable-extensions-except=/home/user/.openbrowser/capsolver-extension')
  .headless(false)
  .stealthMode();

const browser = await OpenBrowser.launch(profile);

// Tạo một đại diện với mô hình yêu thích của bạn
const agent = new Agent({
  browser,
  model: 'gpt-4o',  // hoặc 'claude-sonnet-4-20250514', 'gemini-pro', v.v.
});

// Giao nhiệm vụ cho đại diện - không cần đề cập đến CAPTCHA
await agent.run(`
  Đi đến https://example.com/contact,
  điền biểu mẫu liên hệ với:
    Tên: "Jane Smith"
    Email: "[email protected]"
    Tin nhắn: "Tôi muốn tìm hiểu thêm về gói doanh nghiệp của bạn."
  Chờ 30 giây để trang tải hoàn toàn,
  sau đó nhấp vào Gửi.
  Nói tôi xem thông báo xác nhận nào xuất hiện.
`);

await browser.close();

Lưu ý rằng các hướng dẫn của đại diện nói "chờ 30 giây để trang tải hoàn toàn" - cách diễn đạt tự nhiên cho phép CapSolver thời gian giải bất kỳ CAPTCHA nào trên trang mà AI không bao giờ biết đến.

Bước 7: Thiết lập Xvfb cho máy chủ không đầu

Vì các tiện ích mở rộng MV3 yêu cầu trình duyệt có đầu, bạn cần một màn hình ảo trên máy chủ không có màn hình:

bash Copy
# Cài đặt Xvfb
sudo apt-get install -y xvfb

# Bắt đầu màn hình ảo
Xvfb :99 -screen 0 1280x720x24 &

# Thiết lập DISPLAY trước khi chạy script của bạn
export DISPLAY=:99

Sau đó chạy script OpenBrowser của bạn bình thường. Trình duyệt sẽ hiển thị trên màn hình ảo, và tiện ích mở rộng sẽ tải đúng cách.


Cách hoạt động bên trong

Đối với những người quan tâm đến kỹ thuật, đây là toàn bộ quy trình khi CapSolver được tải vào OpenBrowser:

Copy
  Script của bạn / Đại diện AI
  ──────────────────────────────────────────────────
  LaunchProfile                   OpenBrowser
    .addExtension(path)   ──►  Thêm cờ --load-extension
    .extraArgs(...)             Thêm --disable-extensions-except
    .headless(false)            vào các tham số khởi động Playwright
    .stealthMode()               │
                                 ▼
                            Playwright khởi động Chromium
                            ┌───────────────────────────────┐
                            │  Quy trình Chromium            │
                            │                                │
                            │  1. Dịch vụ worker tiện ích mở rộng   │
                            │     kích hoạt (background.js)  │
                            │                                │
                            │  2. Các script nội dung được chèn   │
                            │     vào mỗi trang              │
                            └───────────────────────────────┘
                                 │
                                 ▼
                            Đại diện điều hướng đến URL đích
                            ┌───────────────────────────────┐
                            │  Trang có widget CAPTCHA      │
                            │                                │
                            │  Tiện ích mở rộng CapSolver:   │
                            │  1. Script nội dung phát hiện   │
                            │     CAPTCHA trên trang         │
                            │  2. Dịch vụ worker gọi         │
                            │     API CapSolver              │
                            │  3. Token nhận được            │
                            │  4. Token được chèn vào        │
                            │     trường biểu mẫu ẩn         │
                            └───────────────────────────────┘
                                 │
                                 ▼
                            Đại diện chờ (30-60 giây)...
                                 │
                                 ▼
                            Đại diện nhấp vào Gửi
                                 │
                                 ▼
                            Biểu mẫu gửi đi với token hợp lệ
                                 │
                                 ▼
                            Trang xác nhận cụ thể của trang web

Cách hoạt động của .addExtension()

.addExtension(path) tạo ra --load-extension=/path/to/extension. Đối với tích hợp này, bạn cũng cần cho phép tiện ích mở rộng chưa đóng gói bằng .extraArgs('--disable-extensions-except=/path/to/extension'). Đây là cơ chế tương tự như tiện ích mở rộng dành cho nhà phát triển Chrome mà OpenBrowser phơi bày qua hồ sơ khởi động của nó.

  1. Playwright khởi động Chromium với --load-extension=/path/to/capsolver-extension
  2. Các tham số bổ sung của bạn cho phép mở rộng này với --disable-extensions-except=/path/to/capsolver-extension
  3. Mở rộng kích hoạt — worker dịch vụ MV3 bắt đầu và các script nội dung được đăng ký để chèn vào
  4. Mỗi lần tải trang — các script nội dung quét DOM để tìm các hộp thoại CAPTCHA đã biết (reCAPTCHA, Turnstile, v.v.)
  5. Khi phát hiện CAPTCHA — script nội dung gửi tin nhắn đến worker dịch vụ, sau đó worker gọi API CapSolver, nhận token giải pháp và chèn nó vào các trường ẩn của trang

Giải pháp thay thế: Cách tiếp cận API CapSolver

Nếu việc tải mở rộng Chrome gặp vấn đề — hoặc bạn muốn kiểm soát rõ ràng hơn quy trình giải CAPTCHA — bạn có thể sử dụng API REST của CapSolver trực tiếp với phiên bản Playwright của OpenBrowser.

Ví dụ đầy đủ

typescript Copy
import { LaunchProfile, OpenBrowser } from 'openbrowser';

const CAPSOLVER_API_KEY = process.env.CAPSOLVER_API_KEY!;

async function solveCaptchaViaAPI(
  pageUrl: string,
  siteKey: string
): Promise<string> {
  const createRes = await fetch("https://api.capsolver.com/createTask", {
    method: "POST",
    headers: { "Content-Type": "application/json" },
    body: JSON.stringify({
      clientKey: CAPSOLVER_API_KEY,
      task: {
        type: "ReCaptchaV2TaskProxyLess",
        websiteURL: pageUrl,
        websiteKey: siteKey,
      },
    }),
  });
  const { taskId, errorDescription } = await createRes.json();
  if (!taskId) throw new Error(`createTask failed: ${errorDescription}`);

  for (let i = 0; i < 40; i++) {
    await new Promise((r) => setTimeout(r, 3000));
    const resultRes = await fetch("https://api.capsolver.com/getTaskResult", {
      method: "POST",
      headers: { "Content-Type": "application/json" },
      body: JSON.stringify({ clientKey: CAPSOLVER_API_KEY, taskId }),
    });
    const result = await resultRes.json();
    if (result.status === "ready") {
      return result.solution.gRecaptchaResponse;
    }
  }
  throw new Error("Solve timeout");
}

// Khởi động mà không cần mở rộng — không cần cờ Chrome đặc biệt
const profile = new LaunchProfile()
  .headless(false)
  .stealthMode();

const browser = await OpenBrowser.launch(profile);
const page = browser.page;

await page.goto("https://example.com/protected-page");

// Phát hiện sitekey
const siteKey = await page.evaluate(() => {
  const el = document.querySelector(".g-recaptcha[data-sitekey]");
  return el?.getAttribute("data-sitekey") ?? "";
});
console.log("Sitekey:", siteKey);

// Giải thông qua API
const token = await solveCaptchaViaAPI(page.url(), siteKey);
console.log("Token nhận được, độ dài:", token.length);

// Chèn token
await page.evaluate((t) => {
  const textarea = document.querySelector(
    'textarea[name="g-recaptcha-response"]'
  ) as HTMLTextAreaElement;
  if (textarea) textarea.value = t;
}, token);

// Gửi
await page.click("#recaptcha-demo-submit");
await page.waitForLoadState("networkidle");

const body = await page.textContent("body");
console.log(
  body?.includes("Verification Success")
    ? "CAPTCHA đã được giải qua API!"
    : body?.slice(0, 200)
);

await browser.close();

Khi nào nên sử dụng API thay vì mở rộng

Mở rộng API
Cài đặt Cấu hình mở rộng + cờ Chrome Chỉ cần khóa API
Phiên bản Chrome Cần Chrome để kiểm tra (lưu ý phiên bản 137+) Hoạt động với bất kỳ Chrome nào
Phát hiện Tự động (script nội dung) Thủ công (truy vấn DOM)
Chèn token Tự động Thủ công (đánh giá JS)
Chế độ không đầu Yêu cầu chế độ có đầu (MV3) Hoạt động trong chế độ không đầu
Tốt nhất cho Tự động hóa liên tục Giải quyết một lần, môi trường không đầu

Giải quyết sự cố

Mở rộng không tải

Triệu chứng: Trình duyệt khởi động nhưng CAPTCHA không được giải. Không có mục liên quan đến mở rộng trong chrome://extensions.

Nguyên nhân: Bạn đang sử dụng Google Chrome thương mại 137+ đang bỏ qua tham số --load-extension một cách im lặng.

Giải pháp: Chuyển sang Chrome for Testing hoặc Chromium được tích hợp trong Playwright. Nếu bạn cần chỉ định tệp thực thi tùy chỉnh:

typescript Copy
const profile = new LaunchProfile()
  .addExtension('/path/to/capsolver-extension')
  .extraArgs('--disable-extensions-except=/path/to/capsolver-extension')
  .executablePath('/path/to/chrome-for-testing/chrome')
  .headless(false)
  .stealthMode();

Xác minh phiên bản Chrome của bạn:

bash Copy
/path/to/your/chrome --version
# Chrome for Testing: "Chromium 143.0.7499.4"
# Chrome thương mại: "Google Chrome 143.0.7499.109"

Mở rộng không hoạt động trong chế độ không đầu

Triệu chứng: Mở rộng tải trong chế độ có đầu nhưng không trong chế độ không đầu.

Nguyên nhân: Mở rộng MV3 (Manifest V3) của Chrome yêu cầu môi trường trình duyệt có đầu. Worker dịch vụ không khởi động trong các chế độ --headless hoặc --headless=new.

Giải pháp: Luôn sử dụng .headless(false) trong LaunchProfile của bạn. Trên máy chủ, sử dụng Xvfb để cung cấp màn hình ảo:

bash Copy
Xvfb :99 -screen 0 1280x720x24 &
export DISPLAY=:99

CAPTCHA không được giải (hình thức thất bại)

Nguyên nhân có thể:

  1. Thời gian chờ không đủ — Tăng lên 60 giây
  2. Khóa API không hợp lệ — Kiểm tra assets/config.js trong thư mục mở rộng của bạn
  3. Số dư không đủ — Nạp tiền tài khoản CapSolver tại capsolver.com
  4. Mở rộng không tải — Xem phần "Mở rộng không tải" ở trên
  5. Mạng nền bị chặn — Nếu bạn đã thêm --disable-background-networking vào tham số Chrome, hãy xóa nó. Mở rộng cần truy cập mạng để gọi API CapSolver.

Xung đột với chế độ che giấu

Triệu chứng: Trang phát hiện trình duyệt là tự động hóa ngay cả khi .stealthMode() được kích hoạt.

Giải pháp: Đảm bảo bạn đang sử dụng Chromium được tích hợp trong Playwright hoặc Chrome for Testing. Một số bản vá che giấu phụ thuộc vào phiên bản Chromium. Đồng thời, đảm bảo bạn không truyền các cờ Chrome xung đột làm ghi đè cài đặt che giấu.


Nguyên tắc tốt nhất

1. Luôn sử dụng thời gian chờ hợp lý

Thời gian chờ dài hơn luôn an toàn. CAPTCHA thường được giải trong 5-20 giây, nhưng độ trễ mạng, thách thức phức tạp hoặc thử lại có thể làm tăng thời gian. 30-60 giây là thời gian lý tưởng.

Loại CAPTCHA Thời gian giải thường Thời gian chờ khuyến khích
reCAPTCHA v2 (nút) 5-15 giây 30-60 giây
reCAPTCHA v2 (ẩn) 5-15 giây 30 giây
reCAPTCHA v3 3-10 giây 20-30 giây
Cloudflare Turnstile 3-10 giây 20-30 giây

2. Sử dụng ngôn ngữ tự nhiên với các đại diện AI

Khi đưa ra hướng dẫn cho các đại diện AI thông qua OpenBrowser, hãy giữ phong cách tự nhiên và tránh đề cập đến CAPTCHA:

Tốt:

"Đi đến trang, chờ khoảng một phút để mọi thứ tải xong, sau đó gửi biểu mẫu."

Tránh:

"Chờ CAPTCHA được giải, sau đó gửi."

Ngôn ngữ tự nhiên hoạt động tốt hơn với LLM và tránh kích hoạt các từ chối an toàn. Đại diện AI không cần biết về CAPTCHA — mở rộng xử lý mọi thứ một cách kín đáo.

3. Cấu hình chế độ token cho CAPTCHA ẩn

Đối với các trang sử dụng reCAPTCHA v3 hoặc reCAPTCHA v2 ẩn, hãy đảm bảo chế độ token được bật trong cấu hình mở rộng (assets/config.js). Chế độ token đảm bảo mở rộng giải quyết thách thức và chèn token mà không yêu cầu tương tác nào.

4. Giám sát số dư CapSolver của bạn

Mỗi lần giải CAPTCHA tốn điểm số. Kiểm tra số dư của bạn tại capsolver.com/dashboard thường xuyên để tránh gián đoạn.

5. Sử dụng .stealthMode() cho môi trường sản xuất

Luôn kích hoạt .stealthMode() trong LaunchProfile của bạn cho mục đích sản xuất. Điều này áp dụng các kỹ thuật tránh nhận diện dấu vân tay, giảm khả năng trình duyệt bị phát hiện là tự động hóa — từ đó giảm khả năng gặp phải CAPTCHA nghiêm ngặt.

typescript Copy
const profile = new LaunchProfile()
  .addExtension('/path/to/capsolver-extension')
  .extraArgs('--disable-extensions-except=/path/to/capsolver-extension')
  .headless(false)
  .stealthMode();  // Luôn kích hoạt trong sản xuất

6. Thiết lập DISPLAY cho máy chủ không đầu

Mở rộng Chrome yêu cầu màn hình, ngay cả trên máy chủ không đầu. Sử dụng Xvfb để tạo màn hình ảo:

bash Copy
# Cài đặt Xvfb
sudo apt-get install -y xvfb

# Bắt đầu màn hình ảo
Xvfb :99 -screen 0 1280x720x24 &

# Thiết lập DISPLAY cho script OpenBrowser của bạn
export DISPLAY=:99

Kết luận

Sự tích hợp OpenBrowser + CapSolver đại diện cho cách tiếp cận sạch sẽ nhất để giải CAPTCHA trong tự động hóa trình duyệt AI. Thay vì viết logic phát hiện CAPTCHA, quản lý các cuộc gọi API, kiểm tra kết quả và chèn token — bạn chỉ cần:

  1. Tải xuống mở rộng CapSolver và giải nén nó vào thư mục
  2. Thêm mở rộng và cho phép nó: .addExtension('/path/to/capsolver-extension') cùng với .extraArgs('--disable-extensions-except=/path/to/capsolver-extension')
  3. Thiết lập headless(false) và sử dụng Xvfb trên máy chủ
  4. Xóa bất kỳ ghi đè nào của --disable-background-networking
  5. Chờ đợi trước khi gửi biểu mẫu để mở rộng có thời gian giải

Không cần thay đổi logic đại diện của bạn. Không có mã cụ thể cho CAPTCHA. Không có sự phụ thuộc giữa mô hình AI của bạn và dịch vụ giải. Mở rộng hoạt động ở cấp độ trình duyệt, hoàn toàn kín đáo với đại diện.

Đây là cách giải CAPTCHA khi nó thực sự tự động hóa: bị ẩn, không cần mã, và không phụ thuộc vào mô hình.


Sẵn sàng bắt đầu chưa? Đăng ký CapSolver và sử dụng mã khuyến mãi OPENBROWSER để nhận thêm 6% tiền thưởng cho lần nạp đầu tiên!


Câu hỏi thường gặp

Tôi có cần sửa đổi lời nhắc của mô hình AI để xử lý CAPTCHA không?

Không. Mở rộng CapSolver hoạt động hoàn toàn ở cấp độ trình duyệt — mô hình AI của bạn (GPT-4o, Claude, Gemini, v.v.) không bao giờ cần biết về CAPTCHA. Chỉ cần bao gồm thời gian chờ hợp lý trong hướng dẫn cho đại diện của bạn (ví dụ: "chờ 30 giây để trang tải hoàn toàn") để mở rộng có thời gian giải các thách thức.

Tại sao tôi không thể sử dụng Chrome thông thường?

Chrome 137+ (phát hành giữa năm 2025) đã xóa hỗ trợ cho cờ dòng lệnh --load-extension trong các phiên bản thương mại. Điều này có nghĩa là mở rộng Chrome không thể được tải trong các phiên bản tự động hóa. Bạn cần Chrome for Testing hoặc Chromium độc lập, vẫn hỗ trợ cờ này. Vì OpenBrowser sử dụng Playwright ở phía dưới, tùy chọn đơn giản nhất là npx playwright install chromium.

Điều này có hoạt động trong chế độ không đầu không?

Không trực tiếp. Mở rộng MV3 (Manifest V3) của Chrome yêu cầu môi trường trình duyệt có đầu — worker dịch vụ không khởi động trong chế độ không đầu. Trên máy chủ không có màn hình, hãy sử dụng Xvfb để tạo màn hình ảo (Xvfb :99 &export DISPLAY=:99). Trình duyệt sẽ hiển thị trên màn hình ảo, và mở rộng sẽ tải bình thường.

CapSolver hỗ trợ những loại CAPTCHA nào?

CapSolver hỗ trợ reCAPTCHA v2 (nút và ẩn), reCAPTCHA v3, reCAPTCHA Enterprise, Cloudflare Turnstile, Cloudflare 5-second Challenge, AWS WAF CAPTCHA, và nhiều hơn nữa. Mở rộng Chrome tự động phát hiện loại CAPTCHA và giải nó tương ứng.

Chi phí của CapSolver là bao nhiêu?

CapSolver cung cấp giá cả cạnh tranh dựa trên loại CAPTCHA và khối lượng. Truy cập capsolver.com để xem giá hiện tại. Sử dụng mã khuyến mãi OPENBROWSER để nhận thêm 6% cho lần nạp đầu tiên.

Điều này có hoạt động với tất cả các mô hình AI được hỗ trợ bởi OpenBrowser không?

Có. Vì CapSolver hoạt động ở cấp độ trình duyệt thông qua một mở rộng Chrome, nó hoạt động giống nhau bất kể mô hình AI nào đang điều khiển đại diện OpenBrowser của bạn — GPT-4o, Claude, Gemini, hoặc bất kỳ mô hình nào khác được hỗ trợ. Mô hình không bao giờ tương tác với quy trình giải CAPTCHA.

Tuyên bố Tuân thủ: Thông tin được cung cấp trên blog này chỉ mang tính chất tham khảo. CapSolver cam kết tuân thủ tất cả các luật và quy định hiện hành. Việc sử dụng mạng lưới CapSolver cho các hoạt động bất hợp pháp, gian lận hoặc lạm dụng là hoàn toàn bị cấm và sẽ bị điều tra. Các giải pháp giải captcha của chúng tôi nâng cao trải nghiệm người dùng trong khi đảm bảo tuân thủ 100% trong việc giúp giải quyết các khó khăn về captcha trong quá trình thu thập dữ liệu công khai. Chúng tôi khuyến khích việc sử dụng dịch vụ của chúng tôi một cách có trách nhiệm. Để biết thêm thông tin, vui lòng truy cập Điều khoản Dịch vụ và Chính sách Quyền riêng tư.

Thêm

OpenBrowser Sử dụng CapSolver
Làm thế nào để giải CAPTCHA trong OpenBrowser bằng cách sử dụng CapSolver (Hướng dẫn tự động hóa AI Agent)

Giải CAPTCHA trong OpenBrowser bằng CapSolver. Tự động hóa reCAPTCHA, Turnstile và hơn thế nữa cho các tác nhân AI một cách dễ dàng.

AI
Logo of CapSolver

Anh Tuan

26-Mar-2026

HyperBrowser với CapSolver
Cách giải CAPTCHA bất kỳ trong HyperBrowser bằng CapSolver (Hướng dẫn cài đặt đầy đủ)

Giải bất kỳ CAPTCHA nào trong HyperBrowser bằng CapSolver. Tự động hóa reCAPTCHA, Turnstile, AWS WAF và nhiều thứ khác một cách dễ dàng.

AI
Logo of CapSolver

Anh Tuan

26-Mar-2026

Giải quyết Captcha cho các tác nhân AI theo dõi giá: Hướng dẫn từng bước
Giải quyết CAPTCHA cho các tác nhân AI theo dõi giá: Hướng dẫn từng bước

Học cách giải quyết hiệu quả CAPTCHAs cho các trợ lý AI theo dõi giá cả với CapSolver. Hướng dẫn từng bước này đảm bảo thu thập dữ liệu không gián đoạn và nhìn nhận thị trường được cải thiện.

AI
Logo of CapSolver

Rajinder Singh

24-Mar-2026

Giải CAPTCHA với TinyFish AgentQ
Cách giải CAPTCHA bằng TinyFish AgentQL – Hướng dẫn từng bước sử dụng CapSolver

Học cách tích hợp CapSolver với TinyFish AgentQL để giải CAPTCHA tự động như reCAPTCHA và Cloudflare Turnstile. Hướng dẫn từng bước với các ví dụ SDK Python và JavaScript để tự động hóa web dựa trên AI liền mạch.

AI
Logo of CapSolver

Nikolai Smirnov

23-Mar-2026

Giải CAPTCHAs với NanoClaw và CapSolver
Làm thế nào để tự động giải CAPTCHA bằng NanoClaw và CapSolver

Hướng dẫn từng bước sử dụng CapSolver với NanoClaw để giải các CAPTCHA như reCAPTCHA, Turnstile, AWS WAF và các loại khác. Hoạt động với các đại diện AI Claude, không cần code và nhiều trình duyệt.

AI
Logo of CapSolver

Rajinder Singh

20-Mar-2026

Giải CAPTCHA bằng Vercel Agent Browser
Cách giải CAPTCHA với Trình duyệt Agent Vercel – Hướng dẫn từng bước sử dụng CapSolver

Học cách tích hợp CapSolver với Agent Browser để xử lý CAPTCHA và xây dựng quy trình tự động hóa AI đáng tin cậy.

AI
Logo of CapSolver

Anh Tuan

18-Mar-2026