CAPSOLVER
Blog
Cách thay đổi User Agent để giải quyết Cloudflare

Cách thay đổi User Agent để giải quyết Cloudflare

Logo of CapSolver

Aloísio Vítor

Image Processing Expert

14-Jan-2025

Tại sao User Agent quan trọng để vượt qua Cloudflare

User Agent là gì?
User Agent (UA) là một chuỗi được trình duyệt hoặc client của bạn gửi đi để tự nhận dạng với server. Nó thường bao gồm các chi tiết như tên trình duyệt, phiên bản, hệ điều hành và loại thiết bị. Ví dụ:
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36.

Cloudflare phân tích chuỗi này để phát hiện bot. Nếu UA của bạn khớp với các công cụ tự động hóa đã biết (ví dụ: Python-Requests hoặc HeadlessChrome), bạn sẽ kích hoạt hệ thống chống bot của Cloudflare.

Bước từng bước: Thay đổi User Agent của bạn

  1. Xác định User Agent mà mục tiêu mong đợi
    Trước khi tùy chỉnh, hãy kiểm tra xem người dùng thực của trang web đang sử dụng User Agent nào. Các công cụ như WhatIsMyBrowser hoặc công cụ dành cho nhà phát triển trình duyệt (tab Network > Headers) có thể giúp ích. Ví dụ: nếu trang web phổ biến với người dùng Chrome, hãy bắt chước UA của họ.

  2. Thiết lập User Agent tùy chỉnh trong Code của bạn
    Dưới đây là cách sửa đổi UA trong các ngôn ngữ lập trình phổ biến:

Python (Thư viện Requests)

python Copy
import requests

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
}

response = requests.get('https://example.com', headers=headers)

JavaScript (Node.js với Axios)

javascript Copy
const axios = require('axios');

axios.get('https://example.com', {
  headers: {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36'
  }
});

Sử dụng Headless Browsers (Puppeteer)

javascript Copy
const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();
  await page.setUserAgent('Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36');
  await page.goto('https://example.com');
})();
  1. Xoay vòng User Agents
    Sử dụng cùng một UA liên tục vẫn có thể bị phát hiện. Xoay vòng UA từ một danh sách đã xác định trước để bắt chước người dùng đa dạng. Các công cụ như Fake UserAgent đơn giản hóa điều này:
python Copy
from fake_useragent import UserAgent
import requests

ua = UserAgent()
headers = {'User-Agent': ua.random}
response = requests.get('https://example.com', headers=headers)

Những sai lầm thường gặp cần tránh

  1. Sử dụng User Agents lỗi thời
    Cloudflare duy trì danh sách các UA đáng ngờ. Tránh các chuỗi gắn liền với các phiên bản trình duyệt cũ (ví dụ: Chrome/58.0.3029.110 từ năm 2017).

  2. Bỏ qua dấu vân tay của Headless Browser
    Ngay cả với UA hợp lệ, các trình duyệt headless vẫn để lộ tín hiệu tự động hóa (ví dụ: thiếu các plugin như navigator.plugins). Sử dụng các plugin bí mật như puppeteer-extra-plugin-stealth.

  3. Quên xoay vòng IP
    Kết hợp xoay vòng UA với proxy dân cư để tránh bị chặn dựa trên IP. Proxy tĩnh hoặc proxy dính hoạt động tốt nhất để duy trì tính nhất quán của phiên.

  4. Kết hợp với dấu vân tay TLS
    Cloudflare kiểm tra các mẫu bắt tay TLS. Các thư viện như curl_cffi (Python) hoặc tls-client (JavaScript) bắt chước dấu vân tay TLS của trình duyệt thực, giảm nguy cơ bị phát hiện.

Suy nghĩ cuối cùng
Thay đổi User Agent của bạn là một cách đơn giản nhưng mạnh mẽ để vượt qua Cloudflare, nhưng nó không phải là hoàn hảo. Kết hợp nó với xoay vòng IP, dấu vân tay TLS và các công cụ chống phát hiện để có kết quả mạnh mẽ.

Chúc bạn thu thập dữ liệu vui vẻ! 🤖

Tuyên bố Tuân thủ: Thông tin được cung cấp trên blog này chỉ mang tính chất tham khảo. CapSolver cam kết tuân thủ tất cả các luật và quy định hiện hành. Việc sử dụng mạng lưới CapSolver cho các hoạt động bất hợp pháp, gian lận hoặc lạm dụng là hoàn toàn bị cấm và sẽ bị điều tra. Các giải pháp giải captcha của chúng tôi nâng cao trải nghiệm người dùng trong khi đảm bảo tuân thủ 100% trong việc giúp giải quyết các khó khăn về captcha trong quá trình thu thập dữ liệu công khai. Chúng tôi khuyến khích việc sử dụng dịch vụ của chúng tôi một cách có trách nhiệm. Để biết thêm thông tin, vui lòng truy cập Điều khoản Dịch vụ và Chính sách Quyền riêng tư.

Thêm

Sử dụng Trình duyệt so với Browserbase: Công cụ tự động hóa trình duyệt nào tốt hơn cho các tác nhân AI?
Cách sử dụng trình duyệt so với Browserbase: Công cụ tự động hóa trình duyệt nào tốt hơn cho các tác nhân AI?

So sánh Browser Use với Browserbase cho tự động hóa bằng trợ lý AI. Khám phá tính năng, giá cả và cách giải CAPTCHAs bằng CapSolver để có luồng công việc mượt mà.

AI
Logo of CapSolver

Aloísio Vítor

27-Jan-2026

Chặn IP vào năm 2026: Cách chúng hoạt động và các cách thực tế để lách lệnh cấm
Cấm IP vào năm 2026: Cách chúng hoạt động và các cách thực tế để vượt qua chúng

Học cách lách chặn IP vào năm 2026 với hướng dẫn toàn diện của chúng tôi. Khám phá các kỹ thuật chặn IP hiện đại và giải pháp thực tế như proxy nhà ở và trình giải CAPTCHA.

web scraping
Logo of CapSolver

Aloísio Vítor

26-Jan-2026

Maxun với tích hợp CapSolver
Cách giải Captcha trong Maxun với tích hợp CapSolver

Một hướng dẫn thực tế về việc tích hợp CapSolver với Maxun cho quét web thực tế. Học cách xử lý reCAPTCHA, Cloudflare Turnstile và các trang web được bảo vệ bằng CAPTCHA bằng cách sử dụng quy trình xác thực trước và luồng công việc robot.

web scraping
Logo of CapSolver

Anh Tuan

21-Jan-2026

Browser4 với Tích hợp CapSolver
Cách giải Captcha trong Browser4 với tích hợp CapSolver

Tự động hóa Browser4 tỷ lệ xử lý cao kết hợp với CapSolver để xử lý các thách thức CAPTCHA trong việc trích xuất dữ liệu web quy mô lớn.

web scraping
Logo of CapSolver

Anh Tuan

21-Jan-2026

Các công cụ trích xuất dữ liệu hàng đầu để sử dụng vào năm 2026 (So sánh toàn diện)
Các công cụ trích xuất dữ liệu hàng đầu nên sử dụng vào năm 2026 (So sánh toàn diện)

Khám phá các công cụ trích xuất dữ liệu tốt nhất cho năm 2026. So sánh các nền tảng hàng đầu trong lĩnh vực quét web, ETL và AI để tự động hóa quy trình thu thập dữ liệu và AI của bạn.

AI
Logo of CapSolver

Aloísio Vítor

21-Jan-2026

7 Công cụ AI Tốt nhất
Top 7 Công cụ AI cho Tự động hóa Web năm 2026

Khám phá 7 công cụ AI Agent tốt nhất cho tự động hóa web vào năm 2026. Chúng tôi đánh giá CrewAI, MultiOn và nhiều công cụ khác, xếp hạng chúng dựa trên hiệu suất trên web thực tế và độ bền cho các AI agent trong môi trường sản xuất.

ai
Logo of CapSolver

Anh Tuan

20-Jan-2026