• 定价
立即开始

© 2026 CapSolver. All rights reserved.

联系我们

Slack: lola@capsolver.com

产品

  • reCAPTCHA v2
  • reCAPTCHA v3
  • Cloudflare Turnstile
  • Cloudflare Challenge
  • AWS WAF
  • 浏览器插件
  • 更多验证码类型

集成

  • Selenium
  • Playwright
  • Puppeteer
  • n8n
  • 合作伙伴
  • 查看所有集成

资源

  • 推荐返佣系统
  • 官方文档
  • API 参考
  • 博客
  • 常见问题 (FAQ)
  • 术语表
  • 系统状态

法律声明

  • 服务条款
  • 隐私政策
  • 退款政策
  • 请勿出售我的信息
博客/All/如何更改用户代理以绕过Cloudflare
Jan21, 2025

如何更改用户代理以绕过Cloudflare

Adélia Cruz

Adélia Cruz

Neural Network Developer

为什么 User Agent 对绕过 Cloudflare 重要

什么是 User Agent?

User Agent (UA) 是浏览器或客户端发送给服务器的一串字符串,用于标识自身。它通常包含浏览器名称、版本、操作系统和设备类型等详细信息。例如:
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36。

Cloudflare 分析此字符串以检测机器人。如果你的 UA 与已知的自动化工具(例如,Python-Requests 或 HeadlessChrome)匹配,你将触发 Cloudflare 的反机器人系统。


分步指南:更改你的 User Agent

1. 识别目标预期的 User Agent

在自定义之前,检查网站的真实用户正在使用哪些 User Agent。像 WhatIsMyBrowser 这样的工具或浏览器开发者工具(Network 标签 > Headers)可以提供帮助。例如,如果该网站在 Chrome 用户中很流行,则模仿他们的 UA。

2. 在你的代码中设置自定义 User Agent

以下是如何在流行的编程语言中修改 UA:

Python (Requests 库)

python Copy
import requests

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
}

response = requests.get('https://example.com', headers=headers)

JavaScript (Node.js 使用 Axios)

javascript Copy
const axios = require('axios');

axios.get('https://example.com', {
  headers: {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
  }
});

使用无头浏览器 (Puppeteer)

javascript Copy
const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.setUserAgent('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36');
  await page.goto('https://example.com');
})();

3. 轮换 User Agent

重复使用相同的 UA 仍然可能被标记。从预定义列表中轮换 UA 以模仿不同的用户。像 Fake UserAgent 这样的工具简化了此过程:

python Copy
from fake_useragent import UserAgent
import requests

ua = UserAgent()
headers = {'User-Agent': ua.random}
response = requests.get('https://example.com', headers=headers)

常见错误

  1. 使用过时的 User Agent
    Cloudflare 保持着可疑 UA 的列表。避免与旧版浏览器相关的字符串(例如,2017 年的 Chrome/58.0.3029.110)。

  2. 忽略无头浏览器指纹
    即使使用有效的 UA,无头浏览器也会泄露自动化信号(例如,缺少像 navigator.plugins 这样的插件)。使用隐身插件,例如 puppeteer-extra-plugin-stealth。

  3. 忘记 IP 轮换
    将 UA 轮换与住宅代理结合使用以避免基于 IP 的封锁。静态或粘性代理最适合保持会话一致性。

  4. 结合 TLS 指纹
    Cloudflare 检查 TLS 握手模式。像 curl_cffi (Python) 或 tls-client (JavaScript) 这样的库可以模仿真实的浏览器 TLS 指纹,从而降低检测风险。


最后的想法

更改你的 User Agent 是一种简单而有效的方法来绕过 Cloudflare,但它并非万无一失。将其与 IP 轮换、TLS 指纹和反检测工具结合使用,以获得可靠的结果。

祝您抓取愉快!🤖

查看更多

May 08, 2026

ReCAPTCHA在电子商务抓取中的应用:以合规为先的指南

了解如何在电子商务数据抓取中处理reCAPTCHA验证码,通过合规的工作流程、诊断、CapSolver示例和实用的风险控制措施来实现。

Ethan Collins
Ethan Collins
May 08, 2026

AI数据提取如何运作:验证码破解、大语言模型解析与结构化网络数据管道

学习AI驱动的数据提取技术,从网页抓取和验证码破解到HTML清理、大语言模型解析以及结构化JSON生成。探索反机器人绕过策略、如AXE这样的语义提取框架以及可扩展的AI网络爬虫管道。

Ethan Collins
Ethan Collins

目录

May 07, 2026

用于网页自动化和验证码解决的最佳人工智能代理框架

比较2026年最佳AI代理框架在网页自动化、验证码解决、合规性和生产就绪代理工作流程中的表现。

Ethan Collins
Ethan Collins
May 07, 2026

最佳Java网络爬虫库用于可靠的数据提取

比较最佳的Java网络爬虫库,包括jsoup、Selenium、Playwright(用于Java)、HtmlUnit、Apache Nutch和API选项。

Ethan Collins
Ethan Collins