
Aloísio Vítor
Image Processing Expert

自动化浏览器交互通常需要处理验证码挑战,尤其是在使用 Puppeteer 等工具时。在本指南中,我们将逐步介绍如何设置 Puppeteer JS 与 CapSolver 浏览器扩展 以高效解决 reCAPTCHA v2。虽然本教程专注于 reCAPTCHA v2,但同样的方法也可以扩展到 CapSolver 支持的其他验证码类型。
在本文结束时,您将了解如何安装所需的依赖项,配置 CapSolver 扩展,并在 Puppeteer 控制的浏览器会话中直接触发验证码解决。
⚠️ 在本博客中,我们将解释如何设置 Puppeteer JS 与 CapSolver 扩展以解决 reCAPTCHA v2。然而,这种方法也可以应用于其他验证码类型。
npm i puppeteer puppeteer-extra puppeteer-extra-plugin-stealth

下载扩展的压缩包,并将其解压到项目根目录下的文件夹 ./CapSolver.Browser.Extension 中。
该扩展有多种设置,包括自动验证码解决、代理支持和细粒度控制选项。这些设置在文件 ./assets/config.json 中可用。
这些设置包括:
{
"apiKey": "您的API密钥",
"useCapsolver": true,
"useProxy": false,
"proxyType": "http",
"hostOrIp": "",
"port": "",
"proxyLogin": "",
"proxyPassword": "",
"enabledForBlacklistControl": false,
"blackUrlList": [],
"enabledForRecaptcha": true,
"enabledForRecaptchaV3": true,
"enabledForcaptcha": true,
"reCaptchaMode": "token",
"captchaMode": "click",
"reCaptchaDelayTime": 0,
"captchaDelayTime": 0,
"reCaptchaRepeatTimes": 10,
"reCaptcha3RepeatTimes": 10,
"captchaRepeatTimes": 10
}
在扩展设置文件 ./assets/config.json 中输入您的 API 密钥。密钥必须分配给 apiKey 字段。您可以直接从 CapSolver 仪表板复制 API 密钥。
示例:
apiKey: "CAP-4FDBD3SDFSD-23S-2-3"
在本示例中,reCaptchaMode 设置为 token。虽然 click 模式也是可用的,但通常推荐使用 token 模式来解决 reCAPTCHA。
const puppeteer = require('puppeteer-extra');
const StealthPlugin = require('puppeteer-extra-plugin-stealth');
const { executablePath } = require('puppeteer');
(async () => {
const pathToExtension = require('path').join(__dirname, 'CapSolver.Browser.Extension');
puppeteer.use(StealthPlugin())
const browser = await puppeteer.launch({
headless: false,
args: [
`--disable-extensions-except=${pathToExtension}`,
`--load-extension=${pathToExtension}`,
],
executablePath: executablePath()
});
const [page] = await browser.pages()
})();
接下来,打开页面 https://www.google.com/recaptcha/api2/demo 并将验证码发送给 CapSolver。
使用 page.goto() 导航到目标页面。验证码可以自动或手动发送进行解决。
在本示例中,我们通过等待验证码复选框并点击它来手动触发。
await page.goto('https://site.example')
// 等待 CSS 选择器为 "#recaptcha-anchor-label" 的元素
await page.waitForSelector('#recaptcha-anchor-label')
// 点击该元素
await page.click('#recaptcha-anchor-label')
const puppeteer = require('puppeteer-extra');
const StealthPlugin = require('puppeteer-extra-plugin-stealth');
const { executablePath } = require('puppeteer');
(async () => {
const pathToExtension = require('path').join(__dirname, 'CapSolver.Browser.Extension');
puppeteer.use(StealthPlugin())
const browser = await puppeteer.launch({
headless: false,
args: [
`--disable-extensions-except=${pathToExtension}`,
`--load-extension=${pathToExtension}`,
],
executablePath: executablePath()
});
const [page] = await browser.pages()
// 打开页面
await page.goto('https://site.example')
// 等待 CSS 选择器为 "#recaptcha-anchor-label" 的元素
await page.waitForSelector('#recaptcha-anchor-label')
// 点击该元素
await page.click('#recaptcha-anchor-label')
})();
您已成功使用 Puppeteer 和 CapSolver 浏览器扩展 解决了 reCAPTCHA v2。此设置提供了一种灵活且可扩展的方式,在真实浏览器环境中直接处理验证码挑战。通过调整扩展配置,可以将相同的流程用于 CapSolver 支持的其他验证码类型,适用于测试、自动化和大规模基于浏览器的任务。
1. 此方法能否在无头模式下使用?
CapSolver 浏览器扩展需要可见的浏览器环境。因此,使用扩展方法时建议将 headless 设置为 false。
2. 此设置是否适用于 reCAPTCHA v2 以外的验证码类型?
是的。CapSolver 扩展支持多种验证码类型。您可以在 config.json 文件中启用或禁用特定的验证码解决器,并相应地调整工作流程。
3. 使用 CapSolver 扩展时是否需要代理?
代理是可选的。扩展支持代理配置,但许多用例无需代理即可运行。代理的使用取决于您的目标网站和自动化需求。
4. reCAPTCHA 的 token 模式和 click 模式有什么区别?
Token 模式通过程序获取验证码解决方案,通常在自动化中更稳定。Click 模式模拟用户与验证码复选框的交互。
5. 此设置能否用于生产环境?
是的。通过适当的配置、错误处理和扩展性考虑,此方法可以集成到生产级别的浏览器自动化工作流中。