• Giá cả
Bắt đầu ngay

© 2026 CapSolver. All rights reserved.

Liên hệ chúng tôi

Slack: lola@capsolver.com

Sản phẩm

  • reCAPTCHA v2
  • reCAPTCHA v3
  • Cloudflare Turnstile
  • Cloudflare Challenge
  • AWS WAF
  • Tiện ích trình duyệt
  • Thêm nhiều loại CAPTCHA

Tích hợp

  • Selenium
  • Playwright
  • Puppeteer
  • n8n
  • Đối tác
  • Xem tất cả tích hợp

Tài nguyên

  • Chương trình giới thiệu
  • Tài liệu
  • Tham chiếu API
  • Blog
  • Câu hỏi thường gặp
  • Thuật ngữ
  • Trạng thái

Pháp lý

  • Điều khoản dịch vụ
  • Chính sách bảo mật
  • Chính sách hoàn tiền
  • Không bán thông tin cá nhân của tôi
//Cách thay đổi User Agent để giải quyết Cloudflare
Jan21, 2025

Cách thay đổi User Agent để giải quyết Cloudflare

Aloísio Vítor

Aloísio Vítor

Image Processing Expert

Tại sao User Agent quan trọng để vượt qua Cloudflare

User Agent là gì?
User Agent (UA) là một chuỗi được trình duyệt hoặc client của bạn gửi đi để tự nhận dạng với server. Nó thường bao gồm các chi tiết như tên trình duyệt, phiên bản, hệ điều hành và loại thiết bị. Ví dụ:
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36.

Cloudflare phân tích chuỗi này để phát hiện bot. Nếu UA của bạn khớp với các công cụ tự động hóa đã biết (ví dụ: Python-Requests hoặc HeadlessChrome), bạn sẽ kích hoạt hệ thống chống bot của Cloudflare.

Bước từng bước: Thay đổi User Agent của bạn

  1. Xác định User Agent mà mục tiêu mong đợi
    Trước khi tùy chỉnh, hãy kiểm tra xem người dùng thực của trang web đang sử dụng User Agent nào. Các công cụ như WhatIsMyBrowser hoặc công cụ dành cho nhà phát triển trình duyệt (tab Network > Headers) có thể giúp ích. Ví dụ: nếu trang web phổ biến với người dùng Chrome, hãy bắt chước UA của họ.

  2. Thiết lập User Agent tùy chỉnh trong Code của bạn
    Dưới đây là cách sửa đổi UA trong các ngôn ngữ lập trình phổ biến:

Python (Thư viện Requests)

python Copy
import requests

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
}

response = requests.get('https://example.com', headers=headers)

JavaScript (Node.js với Axios)

javascript Copy
const axios = require('axios');

axios.get('https://example.com', {
  headers: {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
  }
});

Sử dụng Headless Browsers (Puppeteer)

javascript Copy
const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.setUserAgent('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36');
  await page.goto('https://example.com');
})();
  1. Xoay vòng User Agents
    Sử dụng cùng một UA liên tục vẫn có thể bị phát hiện. Xoay vòng UA từ một danh sách đã xác định trước để bắt chước người dùng đa dạng. Các công cụ như Fake UserAgent đơn giản hóa điều này:
python Copy
from fake_useragent import UserAgent
import requests

ua = UserAgent()
headers = {'User-Agent': ua.random}
response = requests.get('https://example.com', headers=headers)

Những sai lầm thường gặp cần tránh

  1. Sử dụng User Agents lỗi thời
    Cloudflare duy trì danh sách các UA đáng ngờ. Tránh các chuỗi gắn liền với các phiên bản trình duyệt cũ (ví dụ: Chrome/58.0.3029.110 từ năm 2017).

  2. Bỏ qua dấu vân tay của Headless Browser
    Ngay cả với UA hợp lệ, các trình duyệt headless vẫn để lộ tín hiệu tự động hóa (ví dụ: thiếu các plugin như navigator.plugins). Sử dụng các plugin bí mật như puppeteer-extra-plugin-stealth.

  3. Quên xoay vòng IP
    Kết hợp xoay vòng UA với proxy dân cư để tránh bị chặn dựa trên IP. Proxy tĩnh hoặc proxy dính hoạt động tốt nhất để duy trì tính nhất quán của phiên.

  4. Kết hợp với dấu vân tay TLS
    Cloudflare kiểm tra các mẫu bắt tay TLS. Các thư viện như curl_cffi (Python) hoặc tls-client (JavaScript) bắt chước dấu vân tay TLS của trình duyệt thực, giảm nguy cơ bị phát hiện.

Suy nghĩ cuối cùng
Thay đổi User Agent của bạn là một cách đơn giản nhưng mạnh mẽ để vượt qua Cloudflare, nhưng nó không phải là hoàn hảo. Kết hợp nó với xoay vòng IP, dấu vân tay TLS và các công cụ chống phát hiện để có kết quả mạnh mẽ.

Chúc bạn thu thập dữ liệu vui vẻ! 🤖

Xem thêm

May 08, 2026

ReCAPTCHA trong Trích xuất Dữ liệu Thương mại Điện tử: Hướng dẫn Tuân thủ Đầu tiên

Học cách xử lý recaptcha trong quét dữ liệu thương mại điện tử với quy trình tuân thủ, phân tích chẩn đoán, ví dụ từ CapSolver và các biện pháp kiểm soát rủi ro thực tế.

Anh Tuan
Anh Tuan
May 08, 2026

Cách AI trích xuất dữ liệu hoạt động: Giải CAPTCHA, Xử lý LLM và Quy trình dữ liệu web có cấu trúc

Học cách hoạt động của việc trích xuất dữ liệu được hỗ trợ bởi AI từ việc quét web và giải CAPTCHA đến dọn dẹp HTML, phân tích LLM và tạo JSON có cấu trúc. Khám phá các chiến lược tránh bot, các khung khai thác ngữ nghĩa như AXE, và các luồng trích xuất web AI có thể mở rộng.

Anh Tuan

Nội dung

Anh Tuan
May 07, 2026

Các khung công cụ AI tốt nhất dành cho tự động hóa web và giải CAPTCHA

So sánh các khung phần mềm đại diện AI tốt nhất cho tự động hóa web, giải CAPTCHA, tuân thủ và quy trình làm việc của đại diện sẵn sàng sản xuất vào năm 2026.

Anh Tuan
Anh Tuan
May 07, 2026

Những thư viện Java tốt nhất để trích xuất dữ liệu web đáng tin cậy

So sánh các thư viện quét trang web Java tốt nhất, bao gồm jsoup, Selenium, Playwright cho Java, HtmlUnit, Apache Nutch và các tùy chọn API.

Anh Tuan
Anh Tuan
Blog
All