
Anh Tuan
Data Science Expert

Tôi cảm thấy rằng càng nhiều nhiệm vụ tự động hóa hiện nay càng được đánh giá cao, vì vậy các thách thức trở nên rõ ràng và khó khăn hơn. Ví dụ, Cloudflare hiện đang cung cấp các biện pháp bảo mật mạnh mẽ để bảo vệ các trang web khỏi tất cả các công cụ tự động hóa.
Tuy nhiên, việc điều hướng qua các tính năng bảo mật này có thể là một thách thức đối với các nhà phát triển và tổ chức đang thực hiện các dự án tự động hóa như thu thập dữ liệu, trích xuất dữ liệu hoặc kiểm thử. Tuy nhiên, với các công cụ và chiến lược phù hợp, bạn có thể giải quyết hiệu quả những thách thức này trong khi vẫn tuân thủ các tiêu chuẩn pháp lý và đạo đức.
Trong hướng dẫn này, tôi sẽ khám phá cách giải quyết hiệu quả Cloudflare như Turnstile bằng cách sử dụng Puppeteer và Node.js với sự trợ giúp từ công cụ giải mã CAPTCHA.
Nhận mã thưởng Bonus Code của bạn cho các giải pháp CAPTCHA hàng đầu từ CapSolver: WEBS. Sau khi đổi mã, bạn sẽ nhận được thêm 5% tiền thưởng sau mỗi lần nạp, không giới hạn.

Turnstile của Cloudflare là một tính năng bảo mật phức tạp được thiết kế để thách thức người dùng cố gắng truy cập vào các trang web được bảo vệ. Nó sử dụng sự kết hợp của các kỹ thuật, bao gồm các thử thách JavaScript, CAPTCHA và phân tích hành vi để đánh giá xem người dùng có phải là người thật hay không. Đối với các nhà phát triển, điều này có nghĩa là việc vượt qua Turnstile đòi hỏi nhiều hơn chỉ là các kỹ thuật thu thập dữ liệu web truyền thống.
Trước khi đi sâu vào triển khai, hãy đảm bảo bạn có các công cụ và tài nguyên sau:
CapSolver là một công cụ mạnh mẽ được thiết kế để giúp giải mã CAPTCHA và các thách thức tự động khác. Khi các trang web ngày càng triển khai các cơ chế bảo mật phức tạp để ngăn chặn bot và các công cụ thu thập dữ liệu, CapSolver cung cấp một giải pháp đáng tin cậy để vượt qua những trở ngại này.
Dưới đây là phiên bản chi tiết hơn và giàu nội dung hơn của phần giải thích của bạn, kèm theo phần kết thúc cho bài viết:
Sử dụng Puppeteer và JavaScript để gọi API CapSolver và truy cập trang web
Lấy SiteKey cho Turnstile
Sử dụng JavaScript để gọi API CapSolver và lấy mã thông báo
// npm install axios puppeteer-core
const axios = require('axios');
const puppeteer = require("puppeteer-core");
const api_key = "YOUR_API_KEY";
const site_key = "0xxxxxx";
const site_url = "https://xxx.xxx.xxx/xxx";
const proxy = "http://xxx:xxx@x.x.x.x:x"
async function capsolver() {
const payload = {
clientKey: api_key,
task: {
type: 'AntiTurnstileTaskProxyLess',
websiteKey: site_key,
websiteURL: site_url,
metadata: {
action: '', // optional,
type: "turnstile"
},
// proxy: proxy
}
};
try {
const res = await axios.post("https://api.capsolver.com/createTask", payload);
const task_id = res.data.taskId;
if (!task_id) {
console.log("Failed to create task:", res.data);
return;
}
console.log("Got taskId:", task_id);
while (true) {
await new Promise(resolve => setTimeout(resolve, 1000)); // Delay for 1 second
const getResultPayload = {clientKey: api_key, taskId: task_id};
const resp = await axios.post("https://api.capsolver.com/getTaskResult", getResultPayload);
const status = resp.data.status;
if (status === "ready") {
return resp.data.solution.token;
}
if (status === "failed" || resp.data.errorId) {
console.log("Solve failed! response:", resp.data);
return;
}
}
} catch (error) {
console.error("Error:", error);
}
}
const wait = (ms) => new Promise(resolve => setTimeout(resolve, ms));
async function reqSite(){
let coockie;
await capsolver().then(token => {
console.log(token);
coockie = token;
});
const browser = await puppeteer.launch({
headless: false,
executablePath: "Browser Path"
});
const page = await browser.newPage();
await wait(500);
await page.setCookie({
name: "cf_clearance",
value: coockie,
domain: "xx.xx.xx"
});
await wait(500);
await page.goto(site_url);
// TODO
await page.close();
await browser.disconnect();
}
reqSite().then();
Trong hướng dẫn này, chúng ta đã khám phá cách giải quyết hiệu quả tính năng bảo mật Turnst
ile của Cloudflare bằng cách sử dụng kết hợp Puppeteer và CapSolver. Thông qua việc sử dụng các công cụ và phương pháp phù hợp, bạn có thể vượt qua các thử thách tự động hóa một cách hiệu quả, trong khi vẫn đảm bảo tuân thủ các tiêu chuẩn đạo đức và pháp lý.
Học cách khắc phục lỗi Cloudflare Error 1005 bị từ chối truy cập khi quét dữ liệu. Khám phá các giải pháp như proxy nhà ở, dấu vân tay trình duyệt và CapSolver cho CAPTCHA. Tối ưu hóa việc trích xuất dữ liệu.

Khám phá cách xử lý hiệu quả Cloudflare Turnstile trong các quy trình AI bằng các kỹ thuật che giấu của Playwright và CapSolver để giải captcha đáng tin cậy. Học các chiến lược tích hợp thực tế và các phương pháp tốt nhất để tự động hóa không gián đoạn.
