
Anh Tuan
Data Science Expert

Khi các biện pháp bảo mật web ngày càng tiên tiến, reCAPTCHA v3 Enterprise đã trở thành một trong những phương pháp tinh vi nhất để phân biệt giữa bot và người dùng. Không giống như reCAPTCHA v2, reCAPTCHA v3 hoạt động một cách vô hình và đánh giá các tương tác của người dùng để gán điểm "giống bot" hoặc "giống người". Đối với các nhà phát triển làm việc với tự động hóa web, việc giải quyết reCAPTCHA v3 Enterprise có thể là một thách thức, đặc biệt là khi cố gắng đạt được điểm số cao mô phỏng hành vi của con người. Tuy nhiên, với các công cụ phù hợp như Python và Selenium, thách thức này trở nên dễ quản lý.
Trong bài viết này, chúng tôi sẽ hướng dẫn bạn cách thiết lập môi trường, triển khai mã để giải quyết thử thách reCAPTCHA v3
reCAPTCHA v3 Enterprise là phiên bản nâng cao hơn của hệ thống CAPTCHA của Google, được thiết kế để phát hiện lưu lượng truy cập tự động mà không làm gián đoạn trải nghiệm người dùng. Không giống như các phiên bản trước (ví dụ: reCAPTCHA v2), yêu cầu người dùng nhấp vào hình ảnh hoặc đánh dấu vào ô, reCAPTCHA v3 hoạt động một cách vô hình trong nền, sử dụng các thuật toán học máy để gán điểm rủi ro cho mỗi hành động của người dùng.
Thay vì đưa ra các thử thách trực quan cho người dùng, reCAPTCHA v3 gán điểm từ 0 đến 1, trong đó điểm càng gần 0 đại diện cho hoạt động giống bot, và điểm càng gần 1 cho thấy hành vi của con người. Các trang web có thể sử dụng điểm số này để xác định xem có nên chặn hay cho phép hành động cụ thể.
Không giống như reCAPTCHA v2, reCAPTCHA v3 hoạt động một cách vô hình và có thể không hiển thị bất kỳ thử thách CAPTCHA nào. Tuy nhiên, tiện ích reCAPTCHA vẫn tồn tại trong nền của trang web. Để phát hiện nó, hãy kiểm tra HTML của trang web và tìm các phần tử chứa g-recaptcha hoặc tham chiếu đến API CAPTCHA của Google.
Đây là cách bạn có thể xác định sự hiện diện của reCAPTCHA v3:
Mở công cụ dành cho nhà phát triển trong trình duyệt của bạn (nhấp chuột phải vào trang và chọn "Kiểm tra"). Tìm kiếm đoạn mã sau trong nguồn HTML:
<script src="https://www.google.com/recaptcha/api.js" async defer></script>
Bạn có thể sử dụng Selenium để phát hiện reCAPTCHA theo cách lập trình:
try:
driver.find_element(By.XPATH, "//script[contains(@src, 'recaptcha/api.js')]")
print("reCAPTCHA v3 được phát hiện")
except:
print("Không phát hiện reCAPTCHA")
Khi xử lý các thử thách CAPTCHA phức tạp như reCAPTCHA v3 Enterprise, bạn cần một công cụ đáng tin cậy có thể giúp bạn điều hướng những khó khăn trong tự động hóa web mà không bị gắn cờ là bot. Đây là lúc CapSolver phát huy tác dụng.
Nhận Mã khuyến mãi cho các giải pháp captcha hàng đầu; CapSolver: WEBS. Sau khi đổi mã, bạn sẽ nhận được thêm 5% tiền thưởng sau mỗi lần nạp tiền, không giới hạn
Trước khi bắt đầu, hãy đảm bảo bạn có những thứ sau:
Để bắt đầu giải quyết reCAPTCHA v3 Enterprise, bạn cần cài đặt gói CapSolver. Sử dụng lệnh sau để cài đặt nó:
pip install capsolver
Gói này cho phép bạn kết nối với API của CapSolver, được thiết kế đặc biệt để xử lý các thử thách CAPTCHA khác nhau, bao gồm reCAPTCHA v3 Enterprise.
Nếu bạn dự định sử dụng proxy, đây là một kịch bản Python giải quyết reCAPTCHA v3 Enterprise và nhằm mục đích đạt được điểm tương tự con người từ 0,7 đến 0,9:
import capsolver
from urllib.parse import urlparse
# Thay đổi các giá trị này
PROXY = "http://username:password@ip:port"
capsolver.api_key = "YourApiKey"
PAGE_URL = ""
PAGE_KEY = ""
PAGE_ACTION = ""
def solve_recaptcha_v3_enterprise(url, key, pageAction):
solution = capsolver.solve({
"type": "ReCaptchaV3EnterpriseTask",
"websiteURL": url,
"websiteKey": key,
"pageAction": pageAction,
"proxy": PROXY
})
return solution
def main():
print("Đang giải quyết reCAPTCHA v3 Enterprise...")
solution = solve_recaptcha_v3_enterprise(PAGE_URL, PAGE_KEY, PAGE_ACTION)
token = solution["gRecaptchaResponse"]
print("Token giải pháp: ", token)
if __name__ == "__main__":
main()
PROXY: Hãy đảm bảo thay thế phần này bằng thông tin proxy thực tế của bạn theo định dạng http://username:password@ip:port. Nếu bạn đang sử dụng proxy, hãy đảm bảo nó đáng tin cậy để tránh bị gắn cờ là đáng ngờ.
capsolver.api_key: Thay thế "YourApiKey" bằng khóa API CapSolver thực tế của bạn. Bạn có thể tạo khóa này bằng cách đăng nhập vào Bảng điều khiển CapSolver.
PAGE_URL: Thay thế bằng URL của trang web có chứa reCAPTCHA v3 Enterprise.
PAGE_KEY: Đây là khóa reCAPTCHA của trang web, mà bạn cần trích xuất từ trang.
PAGE_ACTION: Hành động cụ thể đang được reCAPTCHA đánh giá. Bạn có thể tìm hiểu cách tìm giá trị này từ hướng dẫn này.
Đối với các trường hợp bạn không sử dụng proxy, script sẽ đơn giản hơn. Đây là cách bạn có thể giải quyết reCAPTCHA v3 Enterprise mà không cần proxy:
import capsolver
from urllib.parse import urlparse
# Thay đổi các giá trị này
capsolver.api_key = "YourApiKey"
PAGE_URL = ""
PAGE_KEY = ""
PAGE_ACTION = ""
def solve_recaptcha_v3_enterprise(url, key, pageAction):
solution = capsolver.solve({
"type": "ReCaptchaV3EnterpriseTaskProxyless",
"websiteURL": url,
"websiteKey": key,
"pageAction": pageAction
})
return solution
def main():
print("Giải quyết reCAPTCHA v3 Enterprise...")
solution = solve_recaptcha_v3_enterprise(PAGE_URL, PAGE_KEY, PAGE_ACTION)
token = solution["gRecaptchaResponse"]
print("Token giải pháp: ", token)
if __name__ == "__main__":
main()
Sử dụng Proxy: Nếu bạn đang gửi nhiều yêu cầu từ cùng một IP, hãy xem xét sử dụng proxy luân phiên để giảm thiểu nguy cơ bị gắn cờ là bot.
Tương tác giống con người: reCAPTCHA v3 gán điểm dựa trên hành vi của người dùng. Để tăng khả năng nhận được điểm giống con người, hãy đảm bảo rằng các tương tác tự động (nhấp chuột, cuộn, điều hướng) của bạn bắt chước hoạt động thực của con người. Việc giới thiệu độ trễ ngẫu nhiên giữa các hành động có thể khiến tự động hóa của bạn trông tự nhiên hơn.
Tối ưu hóa cho điểm 0.7-0.9: CapSolver được xây dựng để cung cấp điểm giống con người từ 0.7 đến 0.9 khi giải quyết reCAPTCHA v3. Để biết thêm thông tin chi tiết về cách tối ưu hóa tự động hóa của bạn cho các điểm như vậy, hãy xem bài đăng trên blog của CapSolver này.
Đang gặp phải lỗi "reCAPTCHA Invalid Site Key" hoặc "token reCAPTCHA không hợp lệ"? Khám phá các nguyên nhân phổ biến, các giải pháp từng bước và mẹo khắc phục sự cố để giải quyết các vấn đề xác minh reCAPTCHA thất bại. Học cách sửa lỗi xác minh reCAPTCHA, vui lòng thử lại.

Học cách giải reCAPTCHA v2 bằng Python và API. Hướng dẫn toàn diện này bao gồm các phương pháp Proxy và không dùng Proxy cùng với mã nguồn có thể triển khai cho tự động hóa.
