
Anh Tuan
Data Science Expert

Một agent LangChain bị chặn bởi reCAPTCHA thường có nghĩa là công cụ của bạn đã truy xuất trang thách thức, không phải dữ liệu bạn muốn. Agent sau đó suy luận dựa trên HTML CAPTCHA và đưa ra câu trả lời sai. Đây là một lỗi truy xuất, không phải lỗi mô hình. Giải pháp là phát hiện thách thức, lấy token reCAPTCHA hợp lệ từ dịch vụ giải quyết và cung cấp token đó trở lại luồng yêu cầu để trang web trả về nội dung thực sự. Hướng dẫn này giải thích tại sao thách thức xuất hiện, cách xử lý nó trong luồng LangChain và cách giảm tần suất thách thức. Các công cụ như CapSolver cung cấp phản hồi token thông qua API đơn giản. Sử dụng các phương pháp này chỉ trên các trang bạn được phép truy cập.
Một agent LangChain bị chặn bởi reCAPTCHA là kết quả của kiểm soát rủi ro, không phải lỗi trong LangChain. Khi một trang xác định một lần truy cập có vẻ tự động, nó sẽ hiển thị một thách thức reCAPTCHA trước khi trả về nội dung. Công cụ truy xuất của agent nhận được trang thách thức này và truyền nó đến mô hình, mô hình không thể hoàn thành nhiệm vụ trực quan hoặc dựa trên token một mình.
Bốn tín hiệu dẫn đến phần lớn các chặn:
reCAPTCHA v3 gán điểm số từ 0.0 đến 1.0 dựa trên các tín hiệu này, nơi điểm số thấp cho thấy khả năng tự động hóa, như được mô tả trong Tài liệu reCAPTCHA v3 của Google. Điểm số thấp sẽ đưa agent LangChain của bạn trực tiếp vào một thách thức.
Phát hiện chặn trước khi agent suy luận với dữ liệu xấu. Một agent LangChain bị chặn bởi reCAPTCHA sẽ nhận được các dấu hiệu nhận biết trong phản hồi. Kiểm tra chúng bên trong công cụ tùy chỉnh của bạn.
Tìm các dấu hiệu sau:
g-recaptcha, grecaptcha hoặc iframe từ google.com/recaptcha.Bao bọc kiểm tra này trong công cụ thực hiện truy xuất. Khi kiểm tra khớp, định tuyến trang đến bước giải quyết thay vì trả lại cho agent. Điều này ngăn agent LangChain bị chặn bởi reCAPTCHA khỏi đưa HTML thách thức vào chuỗi của bạn và lãng phí token trên trang không có câu trả lời.
Sửa chặn trong ba giai đoạn: phát hiện, giải quyết, gửi lại. Giai đoạn giải quyết là nơi tạo ra token reCAPTCHA cho thách thức mà tự động hóa LangChain của bạn gặp phải.
Đọc khóa trang và URL trang từ trang thách thức. Khóa trang reCAPTCHA có thể nhìn thấy trong HTML trang, thường ở thuộc tính data-sitekey hoặc gọi script reCAPTCHA. Bạn cũng cần URL trang đầy đủ và, với reCAPTCHA v3, tên hành động.
Gửi khóa trang và URL trang đến API giải quyết. Dịch vụ xử lý thách thức và trả về chuỗi token. Các mẫu công việc chính cho luồng này được tài liệu hóa trong tham khảo nhiệm vụ reCAPTCHA của CapSolver. Không tự ý tạo tham số; sử dụng loại nhiệm vụ phù hợp với phiên bản thách thức trên trang.
Đặt token trả về vào trường biểu mẫu hoặc tải trọng yêu cầu mà trang mong đợi, thường là g-recaptcha-response, sau đó gửi lại. Trang xác minh token phía máy chủ và trả về nội dung thực sự. Công cụ LangChain của bạn có thể trả lại dữ liệu sạch cho agent.
Nhận mã ưu đãi CapSolver của bạn
Tăng ngân sách tự động hóa của bạn ngay lập tức!
Sử dụng mã ưu đãi CAP26 khi nạp tiền vào tài khoản CapSolver để nhận thêm 5% ưu đãi cho mỗi lần nạp tiền — không giới hạn.
Nhận mã ngay bây giờ trong Bảng điều khiển CapSolver
Trình bày bước giải quyết như một công cụ chuyên dụng để agent gọi chỉ khi cần. Sự tách biệt rõ ràng giúp chuỗi của bạn dễ đọc và các lần thử lại rẻ hơn.
Mẫu thực tế:
Thiết kế này giúp agent LangChain bị chặn bởi reCAPTCHA phục hồi trong một vòng suy luận thay vì thất bại nhiệm vụ. Đối với các luồng dựa trên trình duyệt, token tương tự có thể được chèn vào phiên Playwright hoặc Selenium mà agent kiểm soát.
Giải quyết mỗi thách thức tốn thời gian và ngân sách. Giảm tần suất kích hoạt để agent LangChain của bạn gặp ít thách thức hơn từ đầu.
Áp dụng các biện pháp sau:
Các bước này nâng cao điểm số reCAPTCHA v3 và giảm số lần agent LangChain bị chặn bởi reCAPTCHA cần đến đường giải quyết. Để tìm hiểu sâu hơn về cách lựa chọn dịch vụ giải quyết phù hợp với kiến trúc agent, xem hướng dẫn này về việc chọn dịch vụ CAPTCHA cho cơ sở hạ tầng agent.
| Phương pháp | Xử lý thách thức? | Phù hợp nhất với | Hạn chế |
|---|---|---|---|
| Proxy và tiêu đề tốt hơn | Giảm, không giải quyết | Giảm tần suất thách thức | Thách thức vẫn xuất hiện trên các trang nghiêm ngặt |
| Xem xét thủ công | Có, chậm | Nhiệm vụ một lần | Không mở rộng trong vòng lặp agent |
| Luồng token API giải quyết | Có | Các luồng tự động của LangChain | Yêu cầu tích hợp và ngân sách |
| Chỉ ngữ cảnh trình duyệt thực tế | Đôi khi | Các trang đánh giá JavaScript | Vẫn bị chặn khi thách thức khó xuất hiện |
Một agent LangChain bị chặn bởi reCAPTCHA là vấn đề truy xuất với giải pháp rõ ràng: phát hiện thách thức, lấy token hợp lệ từ dịch vụ giải quyết, chèn vào và gửi lại để trang trả về dữ liệu thực sự. Kết hợp luồng này với proxy nhà riêng, tiêu đề thực tế và tốc độ hợp lý để giữ tần suất thách thức thấp. Luôn giới hạn công việc này chỉ trên các trang và dữ liệu bạn được phép truy cập; khả năng kỹ thuật không cấp phép. Khi bạn sẵn sàng thêm giải pháp token đáng tin cậy cho agent, CapSolver cung cấp API phù hợp trực tiếp vào công cụ LangChain.
Tại sao agent LangChain của tôi trả về trang CAPTCHA thay vì dữ liệu?
Trang phát hiện lưu lượng tự động và hiển thị thách thức trước nội dung. Công cụ truy xuất của bạn nhận được trang thách thức này. Phát hiện nó, giải quyết để nhận token và gửi lại để nhận trang thực sự.
LangChain có thể giải quyết reCAPTCHA một mình không?
Không. Mô hình ngôn ngữ không thể hoàn thành thách thức reCAPTCHA. Bạn cần bước giải quyết trả về token hợp lệ, sau đó công cụ LangChain của bạn chèn token vào yêu cầu.
Các proxy tốt hơn một mình có sửa được chặn không?
Không hoàn toàn. IP nhà riêng, tiêu đề sạch và tốc độ giảm tần suất thách thức, nhưng các trang nghiêm ngặt vẫn phát sinh thách thức, vì vậy bạn cũng cần đường giải quyết token.
Thông tin nào bạn cần để giải quyết thách thức?
Bạn cần khóa trang reCAPTCHA từ trang, URL trang đầy đủ và tên hành động cho reCAPTCHA v3. Gửi những thông tin này đến dịch vụ giải quyết để nhận token.
Việc xử lý reCAPTCHA trong tự động hóa có hợp pháp không?
Chỉ trên các trang bạn sở hữu hoặc được phép truy cập. Việc xử lý thách thức không cấp phép thu thập dữ liệu bị hạn chế, riêng tư hoặc không được phép.
Khắc phục lỗi CAPTCHA trong các agent LangChain với các phiên duyệt web, lỗi công cụ có cấu trúc, xử lý token của AWS WAF, lặp lại và tích hợp CapSolver có trách nhiệm.

Học cách giải CAPTCHA trong quy trình tự động hóa trình duyệt AI bằng cách sử dụng Hermes Agent và CapSolver. Hướng dẫn này giải thích cách tích hợp CapSolver để tự động xử lý reCAPTCHA và các hệ thống CAPTCHA hiện đại khác trong môi trường lướt web tự động mà không cần viết mã phức tạp.
