CAPSOLVER
Blog
Cách giải quyết các thử thách CAPTCHA bằng Python Requests

Cách giải quyết các thử thách CAPTCHA bằng Python Requests

Logo of CapSolver

Aloísio Vítor

Image Processing Expert

23-Jan-2025

Mệt mỏi với CAPTCHA...

1. Tại sao giải quyết CAPTCHA lại quan trọng

Sự đấu tranh bất tận - CAPTCHA cố gắng phân biệt người dùng và bot

Trong khi CAPTCHA bảo vệ các trang web khỏi thư rác, chúng có thể chặn tự động hợp lệ cho:

  • Dự án nghiên cứu: Nghiên cứu học thuật và thị trường thường yêu cầu thu thập dữ liệu quy mô lớn từ các trang web.
  • Công cụ hỗ trợ người khuyết tật: Các công cụ được thiết kế để hỗ trợ người dùng khuyết tật có thể cần điều hướng CAPTCHA để cung cấp nội dung.
  • Tập lệnh di chuyển dữ liệu: Khi chuyển dữ liệu giữa các hệ thống, các tập lệnh tự động có thể gặp phải CAPTCHA.
  • Nghiên cứu học thuật: Các học giả thu thập dữ liệu cho các nghiên cứu về xu hướng internet, hành vi người dùng hoặc việc áp dụng công nghệ.
  • So sánh giá cả và phân tích thị trường: Thu thập giá sản phẩm từ các trang web thương mại điện tử để phân tích xu hướng thị trường.
  • Thu thập dữ liệu sản phẩm thương mại điện tử: Giám sát các trang web của đối thủ cạnh tranh để theo dõi tình trạng sẵn có và giá cả sản phẩm.
  • Xác minh quảng cáo: Đảm bảo rằng quảng cáo trực tuyến được hiển thị chính xác và không bị bot thao túng.
  • SEO và giám sát trang web: Kiểm tra hiệu suất, thời gian hoạt động và thay đổi nội dung của trang web một cách tự động.
  • Thu thập dữ liệu mạng xã hội: Tích hợp các bài đăng công khai hoặc xu hướng từ các nền tảng xã hội để phân tích tâm lý.
  • Nghiên cứu an ninh mạng: Phân tích các lỗ hổng tiềm ẩn hoặc kiểm tra tính mạnh mẽ của các biện pháp bảo mật.
  • Tổng hợp nội dung: Tự động thu thập các bài báo hoặc bài đăng trên blog cho các dịch vụ tổng hợp tin tức.

2. Thiết lập bộ công cụ của bạn

Bảng điều khiển Capsolver - nơi khóa API nằm

Cài đặt các yêu cầu:

bash Copy
pip install requests

Lấy khóa API của bạn:

  1. Tạo tài khoản tại capsolver.com
  2. Điều hướng đến Tổng quan API
  3. Sao chép clientKey của bạn

3. Triển khai từng bước

Cách thức hoạt động của quá trình giải quyết CAPTCHA

Hướng dẫn mã hoàn chỉnh:

python Copy
# pip install requests
import requests
import time
 
# TODO: thiết lập cấu hình của bạn
api_key = "YOUR_API_KEY"  # khóa api của bạn của capsolver
site_key = "6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_kl-"  # khóa site của trang web mục tiêu của bạn
site_url = ""  # url trang của trang web mục tiêu của bạn
 
 
def capsolver():
    payload = {
        "clientKey": api_key,
        "task": {
            "type": 'ReCaptchaV3TaskProxyLess',
            "websiteKey": site_key,
            "websiteURL": site_url,
            "pageAction": "login",
        }
    }
    res = requests.post("https://api.capsolver.com/createTask", json=payload)
    resp = res.json()
    task_id = resp.get("taskId")
    if not task_id:
        print("Thất bại khi tạo tác vụ:", res.text)
        return
    print(f"Đã nhận được taskId: {task_id} / Đang lấy kết quả...")
 
    while True:
        time.sleep(1)  # độ trễ
        payload = {"clientKey": api_key, "taskId": task_id}
        res = requests.post("https://api.capsolver.com/getTaskResult", json=payload)
        resp = res.json()
        status = resp.get("status")
        if status == "ready":
            return resp.get("solution", {}).get('gRecaptchaResponse')
        if status == "failed" or resp.get("errorId"):
            print("Giải quyết thất bại! phản hồi:", res.text)
            return
 
 
token = capsolver()
print(token)

4. Hiểu các loại tác vụ

Các loại CAPTCHA phổ biến mà bạn sẽ gặp phải

Loại tác vụ
ReCaptchaV2Task / ReCaptchaV2TaskProxyless
ReCaptchaV3Task / ReCaptchaV3TaskProxyless
GeeTestTask / GeeTestTaskProxyless
AntiTurnstileTaskProxyless
ImageToTextTask

5. Khắc phục sự cố thông thường

Khi giải pháp CAPTCHA của bạn thất bại...

Các bản sửa lỗi thông thường:

  • Kiểm tra lại quyền của khóa API
  • Xác minh URL trang web, websiteKey, pageAction hoặc các tham số bắt buộc/tùy chọn khác khớp chính xác
  • Thử nghiệm với các loại CAPTCHA khác nhau
  • Liên hệ hỗ trợ capsolver

Tuyên bố Tuân thủ: Thông tin được cung cấp trên blog này chỉ mang tính chất tham khảo. CapSolver cam kết tuân thủ tất cả các luật và quy định hiện hành. Việc sử dụng mạng lưới CapSolver cho các hoạt động bất hợp pháp, gian lận hoặc lạm dụng là hoàn toàn bị cấm và sẽ bị điều tra. Các giải pháp giải captcha của chúng tôi nâng cao trải nghiệm người dùng trong khi đảm bảo tuân thủ 100% trong việc giúp giải quyết các khó khăn về captcha trong quá trình thu thập dữ liệu công khai. Chúng tôi khuyến khích việc sử dụng dịch vụ của chúng tôi một cách có trách nhiệm. Để biết thêm thông tin, vui lòng truy cập Điều khoản Dịch vụ và Chính sách Quyền riêng tư.

Thêm

Các User Agent Tốt Nhất để Scrape Web & Cách Sử Dụng Chúng
Các User Agent Tốt Nhất để Scrape Web & Cách Sử Dụng Chúng

Hướng dẫn về các user agent tốt nhất để scrape web và cách sử dụng hiệu quả để tránh bị phát hiện. Khám phá tầm quan trọng của user agent, các loại và cách triển khai chúng để scrape web liền mạch và không bị phát hiện.

Logo of CapSolver

Anh Tuan

07-Mar-2025

Cách giải quyết thử thách Cloudflare JS để thu thập dữ liệu web và tự động hóa
Cách giải quyết thử thách Cloudflare JS để thu thập dữ liệu web và tự động hóa

Tìm hiểu cách giải quyết thử thách JavaScript của Cloudflare để thu thập dữ liệu web và tự động hóa liền mạch. Khám phá các chiến lược hiệu quả, bao gồm sử dụng trình duyệt không đầu, luân phiên proxy, và tận dụng khả năng giải quyết CAPTCHA nâng cao của CapSolver.

Cloudflare
Logo of CapSolver

Anh Tuan

05-Mar-2025

Dấu vân tay TLS của Cloudflare: Nó là gì và cách giải quyết
Dấu vân tay TLS của Cloudflare: Nó là gì và cách giải quyết

Tìm hiểu về việc Cloudflare sử dụng dấu vân tay TLS để bảo mật, cách nó phát hiện và chặn bot, và khám phá các phương pháp hiệu quả để giải quyết vấn đề này cho các tác vụ thu thập dữ liệu web và duyệt web tự động.

Cloudflare
Logo of CapSolver

Anh Tuan

28-Feb-2025

Tại sao tôi cứ bị yêu cầu xác minh rằng tôi không phải là người máy?
Tại sao tôi cứ bị yêu cầu xác minh rằng tôi không phải là người máy?

Tìm hiểu lý do tại sao Google yêu cầu bạn xác minh rằng bạn không phải là robot và khám phá các giải pháp như sử dụng API của CapSolver để giải quyết các thử thách CAPTCHA một cách hiệu quả.

Logo of CapSolver

Anh Tuan

27-Feb-2025

Cách trích xuất dữ liệu từ trang web được bảo vệ bởi Cloudflare
Cách trích xuất dữ liệu từ trang web được bảo vệ bởi Cloudflare

Trong hướng dẫn này, chúng ta sẽ khám phá các kỹ thuật đạo đức và hiệu quả để trích xuất dữ liệu từ các trang web được bảo vệ bởi Cloudflare.

Cloudflare
Logo of CapSolver

Anh Tuan

20-Feb-2025

Tại sao các trang web lại nghĩ tôi là bot? Và cách giải quyết chúng
Tại sao các trang web lại nghĩ tôi là bot? Và cách giải quyết chúng

Hiểu tại sao các trang web đánh dấu bạn là bot và cách tránh bị phát hiện. Các tác nhân chính bao gồm các thử thách CAPTCHA, IP đáng ngờ và hành vi trình duyệt bất thường.

Logo of CapSolver

Anh Tuan

20-Feb-2025