
Adélia Cruz
Neural Network Developer
User Agent (UA) 是浏览器或客户端发送给服务器的一串字符串,用于标识自身。它通常包含浏览器名称、版本、操作系统和设备类型等详细信息。例如:
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36。
Cloudflare 分析此字符串以检测机器人。如果你的 UA 与已知的自动化工具(例如,Python-Requests 或 HeadlessChrome)匹配,你将触发 Cloudflare 的反机器人系统。
在自定义之前,检查网站的真实用户正在使用哪些 User Agent。像 WhatIsMyBrowser 这样的工具或浏览器开发者工具(Network 标签 > Headers)可以提供帮助。例如,如果该网站在 Chrome 用户中很流行,则模仿他们的 UA。
以下是如何在流行的编程语言中修改 UA:
import requests
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
}
response = requests.get('https://example.com', headers=headers)
const axios = require('axios');
axios.get('https://example.com', {
headers: {
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
}
});
const puppeteer = require('puppeteer');
(async () => {
const browser = await puppeteer.launch();
const page = await browser.newPage();
await page.setUserAgent('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36');
await page.goto('https://example.com');
})();
重复使用相同的 UA 仍然可能被标记。从预定义列表中轮换 UA 以模仿不同的用户。像 Fake UserAgent 这样的工具简化了此过程:
from fake_useragent import UserAgent
import requests
ua = UserAgent()
headers = {'User-Agent': ua.random}
response = requests.get('https://example.com', headers=headers)
使用过时的 User Agent
Cloudflare 保持着可疑 UA 的列表。避免与旧版浏览器相关的字符串(例如,2017 年的 Chrome/58.0.3029.110)。
忽略无头浏览器指纹
即使使用有效的 UA,无头浏览器也会泄露自动化信号(例如,缺少像 navigator.plugins 这样的插件)。使用隐身插件,例如 puppeteer-extra-plugin-stealth。
忘记 IP 轮换
将 UA 轮换与住宅代理结合使用以避免基于 IP 的封锁。静态或粘性代理最适合保持会话一致性。
结合 TLS 指纹
Cloudflare 检查 TLS 握手模式。像 curl_cffi (Python) 或 tls-client (JavaScript) 这样的库可以模仿真实的浏览器 TLS 指纹,从而降低检测风险。
更改你的 User Agent 是一种简单而有效的方法来绕过 Cloudflare,但它并非万无一失。将其与 IP 轮换、TLS 指纹和反检测工具结合使用,以获得可靠的结果。
祝您抓取愉快!🤖
比较2026年最佳AI代理框架在网页自动化、验证码解决、合规性和生产就绪代理工作流程中的表现。
