Jun12, 2026

Memperbaiki Agen AI yang Terbatas Laju dan Diblokir

Emma Foster

Machine Learning Engineer

Agen AI meminta papan anggaran menunjukkan kontrol 429 dan 403

TL;DR

Klasifikasikan 429 sebagai sinyal penjadwalan dan 403 sebagai sinyal penolakan sebelum mengganti proxy, penanganan CAPTCHA, atau panduan perencana.
Hormati Retry-After ketika tersedia, dan buat pendinginan lokal ketika server tidak menyertakannya tetapi permintaan berulang tetap gagal.
Berikan setiap run agen anggaran permintaan per host, akun, endpoint, dan tindakan agar ulangan tidak tumbuh tanpa niat operator.
Pengendalian kecepatan harus terjadi sebelum peluncuran browser; memperlambat klik setelah kelebihan beban sudah terlambat.
Kebijakan proxy dan akun harus dievaluasi bersama karena rute bersih tidak dapat menyelamatkan akun yang melebihi penggunaan yang diizinkan.

Pendahuluan

Agen yang dibatasi laju membutuhkan kontrol lalu lintas sebelum membutuhkan trik browser tambahan. 429, 403, halaman CAPTCHA, dan redirect diam semua menunjukkan kelas kegagalan yang berbeda, jadi perbaikan dimulai dengan disiplin kode status. CapSolver berguna ketika alur kerja yang diizinkan mencapai tantangan yang didukung setelah penjadwalan yang bertanggung jawab, tetapi tidak boleh menyembunyikan kelebihan beban, penyalahgunaan akun, atau ketiadaan izin. Untuk agen AI yang dibatasi laju dan diblokir, tangkap endpoint, akun, rute proxy, jumlah permintaan, interval ulang, header respons, dan tindakan perencana yang menyebabkan penolakan. Kemudian pindahkan pengendalian kecepatan ke scheduler, bukan ke keputusan terakhir model. Hasilnya adalah tingkat blokir yang lebih rendah dan tanggung jawab yang lebih jelas.

Membedakan Tekanan 429 dari Penolakan 403

Anggap 429 dan 403 sebagai sinyal operasional yang berbeda. HTTP 429 mengatakan klien telah mengirim terlalu banyak permintaan dalam periode, sedangkan HTTP 403 berarti server memahami permintaan dan menolaknya. Definisi HTTP 429 Terlalu Banyak Permintaan dan HTTP 403 Dilarang memberikan dasar yang jelas untuk klasifikasi log. Jika tim mengelompokkan kedua hasil tersebut di bawah label "diblokir", perbaikannya menjadi bising: satu insinyur memperlambat permintaan, yang lain mengganti rute, dan agen terus mengulangi rencana yang sama.

Buat klasifikasi status untuk agen AI yang dibatasi laju dan diblokir. 429 harus mencatat host, endpoint, akun, rute, header ulang, dan jumlah permintaan terbaru. 403 harus mencatat status otorisasi, status akun, rute, jalur, penanda halaman CAPTCHA, dan kelas body respons. Halaman CAPTCHA harus mencatat apakah mengikuti permintaan cepat atau muncul pada kontak pertama. Kategori ini memungkinkan jalur perbaikan terpisah.

Jangan biarkan perencana memutuskan bahwa setiap penolakan pantas mendapat upaya tambahan. Alat browser harus mengembalikan rate_limited, forbidden, challenge_detected, atau auth_required sebagai status terstruktur. Perubahan satu ini menjaga agen AI yang dibatasi laju dan diblokir dari mengubah cooldown kecil menjadi lockout yang lebih besar.

Hormati Retry-After dan Bangun Pendinginan Lokal

Waktu ulang harus didorong oleh umpan balik server ketika server menyediakannya. Field respons Retry-After mendefinisikan field respons yang dapat memberi tahu klien kapan mencoba lagi. Jika muncul, antrian harus menghormatinya secara tepat kecuali kebijakan internal yang lebih ketat berlaku. Jika tidak muncul, gunakan pendinginan lokal yang konservatif berdasarkan kepadatan kegagalan terbaru, biaya endpoint, dan prioritas bisnis.

Pendinginan yang baik memiliki cakupan. Satu halaman produk mungkin membutuhkan penundaan per host, sementara tindakan menulis membutuhkan jeda per akun. Halaman pencarian, halaman login, jalur checkout, dan endpoint seperti API tidak boleh berbagi satu penundaan ulang umum. Agen AI yang dibatasi laju dan diblokir menjadi lebih mudah dioperasikan ketika setiap tindakan memiliki biaya yang jelas. Baca bisa biaya satu unit, pencarian bisa biaya lebih banyak, dan submit formulir yang gagal bisa menghabiskan seluruh anggaran run.

Vokabular kualitas proxy CapSolver membantu tim memisahkan kualitas rute dari penjadwalan. Rute dengan reputasi buruk bisa gagal segera, tetapi rute yang baik masih bisa menerima 429 jika agen melebihi kecepatan yang diharapkan situs. Perbaikan pertama adalah menghormati pendinginan, bukan mengganti identitas selama sesi.

Berikan Setiap Agen Anggaran Permintaan

Anggaran menghentikan loop model dari berubah menjadi insiden lalu lintas. Tetapkan jumlah maksimum per host, kelompok endpoint, akun, rute, dan run tugas. Sertakan permintaan navigasi dan panggilan latar belakang ketika mungkin karena halaman modern bisa memicu banyak aset dan permintaan API setelah satu tindakan yang terlihat. Ketika agen AI yang dibatasi laju dan diblokir tidak memiliki anggaran, satu langkah perencana yang tidak pasti bisa memperbarui, mencari, membuka halaman detail, kembali, dan mengulangi hingga target menolak semua lalu lintas.

Atur anggaran sebelum browser dimulai. Scheduler harus tahu berapa banyak run yang boleh masuk ke host, berapa halaman yang boleh dikunjungi per run, berapa tindakan tulis yang diizinkan, dan berapa penolakan yang mengakhiri pekerjaan. Lapisan browser masih bisa mengamati sinyal, tetapi tidak boleh menjadi satu-satunya pengendali. Gunakan pedoman kontrol pembatasan laju sebagai pengingat berbasis keamanan bahwa upaya berulang adalah sinyal risiko, bahkan ketika setiap permintaan individual terlihat kecil.

Anggaran harus terlihat di log. Catat biaya yang direncanakan, biaya yang digunakan, biaya yang tersisa, dan alasan tugas berhenti. Ini membuat agen AI yang dibatasi laju dan diblokir cukup prediktif bagi tim operasional untuk memprediksi kapasitas dan bagi tim kepatuhan untuk meninjau batas akses.

Klaim Kode Bonus CapSolver Anda

Tingkatkan anggaran otomasi Anda secara instan!
Gunakan kode bonus CAP26 saat menambahkan dana ke akun CapSolver Anda untuk mendapatkan tambahan 5% bonus pada setiap penyetoran — tanpa batas.
Klaim sekarang di Dasbor CapSolver Anda

Antrian Pekerjaan Sebelum Mengakses Browser

Pengendalian kecepatan antrian bekerja paling baik di hulu. Jika sepuluh agen meluncurkan browser dan kemudian menunggu di alur halaman, lalu lintas sudah terlihat oleh target. Letakkan antrian di depan pembuatan browser, resolusi DNS, login, dan navigasi halaman. Atur konkurensi berdasarkan host dan kelompok akun. Beri tindakan berisiko tinggi, seperti loop pencarian atau submit formulir, jalur lebih kecil daripada halaman detail bacaan.

Gunakan bucket token atau bucket bocor untuk penjadwalan yang terprediksi. Tambahkan jitter agar banyak pekerjaan tidak dilanjutkan pada milisekon yang sama setelah pendinginan. Cache bacaan stabil dan deduplikasi pekerjaan yang sama sebelum mereka menghabiskan kapasitas browser. Jika agen ingin halaman yang sama dua kali selama satu tugas, kembalikan pengamatan yang disimpan kecuali perubahan keadaan nyata diharapkan. Kontrol ini mengurangi beban dan menurunkan kemungkinan bahwa agen AI yang dibatasi laju dan diblokir memicu penolakan keseluruhan situs.

Diskusi tentang kontrol scraping yang diblokir paling berguna ketika diterjemahkan ke dalam kebijakan antrian: permintaan yang lebih sedikit, kepemilikan rute yang lebih jelas, dan kondisi berhenti untuk penolakan. Desain antrian bukan hanya pekerjaan kinerja. Ini bagian dari otomasi yang bertanggung jawab.

Selaraskan Strategi Proxy, Akun, dan Izin

Perubahan proxy tidak boleh digunakan sebagai refleks. Rute permintaan, akun, kumpulan cookie, keluarga user-agent, dan lokasi geografis perlu membuat sense bersama. Jika akun yang masuk muncul dari beberapa wilayah selama satu tugas, atau jika rute berubah antara render dan submit tantangan, situs mungkin meningkatkan validasi. Agen AI yang dibatasi laju dan diblokir sering gagal karena kebijakan rute dan kebijakan akun dirancang oleh tim yang berbeda.

Buat matriks untuk kelompok akun, wilayah yang diizinkan, kumpulan proxy yang diizinkan, sesi paralel maksimum, dan aturan pendinginan. Tinjau kinerja proxy dengan metode yang dapat diulang seperti desain benchmark proxy CapSolver, tetapi jangan menganggap keberhasilan benchmark sebagai izin untuk meningkatkan volume. Kebijakan akses publik masih penting, dan Protokol Pengecualian Robot adalah dasar yang berguna untuk tata kelola crawler.

Ketika CAPTCHA muncul setelah penjadwalan yang bertanggung jawab dan alur kerja diizinkan, CapSolver dapat ditempatkan sebagai langkah tantangan yang dikendalikan. Jika 403 muncul sebelum pola permintaan yang wajar, perbaiki izin akses, status akun, atau kebijakan target terlebih dahulu. Perbedaan ini menjaga agen AI yang dibatasi laju dan diblokir dari menyembunyikan penolakan dengan ulangan tambahan.

Bangun Antrian Sebelum Browser Dibuka

Pengendalian laju harus dimulai sebelum instans browser mana pun diluncurkan. Antrian dapat memutuskan apakah tugas diizinkan untuk dimulai berdasarkan anggaran host, anggaran akun, anggaran rute, dan biaya endpoint. Ini lebih kuat daripada meminta agen browser untuk melambatkan setelah sudah membuka tab dan memulai navigasi. Untuk agen AI yang dibatasi laju dan diblokir, penjadwalan sebelum peluncuran mencegah model dari menciptakan ledakan tak sengaja.

Desain antrian berdasarkan prioritas bisnis. Tugas pemantauan bisa menunggu di belakang tugas QA checkout. Tugas yang berat pencarian bisa berjalan dengan batas konkurensi yang lebih kecil daripada bacaan halaman detail tunggal. Tugas yang gagal harus mengembalikan anggaran yang tidak digunakan daripada mengulang secara buta. Ketika host mulai mengembalikan 429, antrian harus mendinginkan host secara global, bukan hanya run agen tunggal yang kebetulan mengamati respons tersebut. Ini mengubah pembatasan laju dari kesalahan browser menjadi keputusan penjadwalan normal.

Tinjau Akun, Rute, dan Endpoint Bersamaan

Sinyal akun, rute, dan endpoint saling berinteraksi. Akun yang tepercaya pada rute yang tidak stabil bisa gagal. Rute bersih dengan akun yang terlalu digunakan bisa gagal. Endpoint biaya rendah bisa tetap sehat sementara endpoint login, pencarian, atau submit formulir sudah dalam tekanan. Agen AI yang dibatasi laju dan diblokir membutuhkan analisis yang mengelompokkan dimensi ini alih-alih mengubah satu lapisan demi satu.

Buat dashboard operasional kecil. Lacak permintaan, 429, 403, halaman tantangan, rata-rata pendinginan, jumlah ulang, keberhasilan akhir, kelas ID akun, kelas rute, dan kelompok endpoint. Metrik yang berguna bukan hanya jumlah blokir; itu adalah rasio tugas yang selesai terhadap peristiwa validasi. Jika validasi tumbuh lebih cepat daripada pekerjaan yang selesai, hentikan dan tinjau rencana. Sistem yang bertanggung jawab harus mengurangi tekanan ketika sinyal memburuk, bukan menghabiskan anggaran otomasi lebih banyak untuk memaksa jalur yang sama.

Tulis Kebijakan Backoff yang Tidak Bisa Diubah Model

Backoff harus berada di kode, bukan di suasana hati agen. Tetapkan penundaan ulang pertama, jumlah maksimum ulang, rentang jitter, cakupan pendinginan, dan kondisi berhenti di luar prompt. Agen bisa melaporkan mengapa membutuhkan upaya tambahan, tetapi scheduler harus memutuskan apakah upaya tersebut diizinkan. Ini mencegah respons model yang persuasif dari mengganti sinyal situs yang jelas meminta klien untuk melambat.

Buat alasan berhenti terlihat di output tugas akhir. Run yang dihentikan harus menyebutkan host cooldown, anggaran akun habis, penolakan endpoint, atau otorisasi tidak jelas daripada kegagalan yang samar. Kata-kata ini membantu operator membedakan pembatasan sehat dari otomasi yang rusak. Untuk agen AI yang dibatasi laju dan diblokir, berhenti dengan bersih adalah perilaku keselamatan yang sukses, bukan tugas yang gagal.

Buka Kembali Lalu Lintas Secara Bertahap Setelah Pendinginan

Pemulihan harus bertahap. Ketika pendinginan berakhir, mulai dengan satu permintaan biaya rendah, lalu sejumlah kecil, lalu volume normal hanya jika sinyal penolakan tetap rendah. Jangan melanjutkan seluruh daftar tugas yang tertunda sekaligus. Antrian yang melepaskan setiap tugas yang tertunda bersamaan bisa menciptakan pola 429 yang sama dalam detik.

Tulis aturan pemulihan di samping aturan jeda. Sertakan siapa yang bisa mengubahnya, endpoint mana yang dikecualikan, dan bagaimana keberhasilan diukur. Ini menjaga agen AI yang dibatasi laju dan diblokir dari bergoyang antara beban dan pemulihan sepanjang hari.

Kesimpulan

Memperbaiki agen AI yang dibatasi laju dan diblokir dimulai dengan klasifikasi. Pisahkan 429 dari 403, hormati Retry-After, terapkan anggaran permintaan, kendalikan sebelum peluncuran browser, dan pertahankan kebijakan proxy dan akun yang konsisten. Penanganan tantangan harus dilakukan setelah kontrol ini, bukan sebelumnya.

Ketika otomasi yang diizinkan masih mencapai tantangan CAPTCHA yang didukung di bawah anggaran permintaan yang wajar, uji langkah ini dengan CapSolver dan pertahankan metrik penolakan terpisah dari metrik penyelesaian.

FAQ

Apa log pertama yang harus diperiksa untuk agen yang diblokir?

Periksa status HTTP dan header respons, lalu kelompokkan kejadian berdasarkan endpoint, akun, rute, dan tindakan perencana. Ini mencegah 429 dan 403 diperbaiki dengan cara yang sama.

Apakah agen selalu harus menunggu Retry-After?

Ya, ketika header tersedia dan valid. Kebijakan internal bisa menunggu lebih lama, tetapi tidak boleh mengulang lebih cepat daripada cooldown yang dinyatakan server.

Apakah proxy baru bisa memperbaiki pembatasan laju?

Terkadang kualitas rute penting, tetapi proxy baru tidak akan memperbaiki volume berlebih, izin yang hilang, akun yang terkunci, atau perilaku sesi yang tidak konsisten.

Di mana pengendalian kecepatan seharusnya berada?

Letakkan pengendalian kecepatan utama di scheduler atau antrian sebelum peluncuran browser. Alat browser tetap harus mendeteksi status penolakan dan menghentikan perencana.

Kapan CapSolver relevan untuk masalah ini?

CapSolver relevan ketika alur kerja yang diizinkan mencapai CAPTCHA yang didukung setelah kontrol penjadwalan, izin, akun, dan rute sudah diterapkan.

Lihat Lebih Banyak

AIJul 31, 2026

Cara menyelesaikan CAPTCHA dalam agen LlamaIndex

Integrasikan penyelesaian CAPTCHA ke dalam agen LlamaIndex menggunakan FunctionTool dan CapSolver untuk pipeline pengumpulan data web.

Emma Foster

AIJul 31, 2026

Cara Menyelesaikan CAPTCHA dengan MCP: Model Konteks Protokol Layanan CapSolver

Atur layanan CapSolver MCP untuk penyelesaian CAPTCHA tanpa kode di Claude Desktop, Cursor, dan setiap klien MCP.

Memperbaiki Agen AI yang Terbatas Laju dan Diblokir

TL;DR

Pendahuluan

Membedakan Tekanan 429 dari Penolakan 403

Hormati Retry-After dan Bangun Pendinginan Lokal

Berikan Setiap Agen Anggaran Permintaan

Klaim Kode Bonus CapSolver Anda

Antrian Pekerjaan Sebelum Mengakses Browser

Selaraskan Strategi Proxy, Akun, dan Izin

Bangun Antrian Sebelum Browser Dibuka

Tinjau Akun, Rute, dan Endpoint Bersamaan

Tulis Kebijakan Backoff yang Tidak Bisa Diubah Model

Buka Kembali Lalu Lintas Secara Bertahap Setelah Pendinginan

Kesimpulan

FAQ

Apa log pertama yang harus diperiksa untuk agen yang diblokir?

Apakah agen selalu harus menunggu Retry-After?

Apakah proxy baru bisa memperbaiki pembatasan laju?

Di mana pengendalian kecepatan seharusnya berada?

Kapan CapSolver relevan untuk masalah ini?

Lihat Lebih Banyak

Cara menyelesaikan CAPTCHA dalam agen LlamaIndex

Cara Menyelesaikan CAPTCHA dengan MCP: Model Konteks Protokol Layanan CapSolver

Memperbaiki Agen AI yang Terbatas Laju dan Diblokir

TL;DR

Pendahuluan

Membedakan Tekanan 429 dari Penolakan 403

Hormati Retry-After dan Bangun Pendinginan Lokal

Berikan Setiap Agen Anggaran Permintaan

Klaim Kode Bonus CapSolver Anda

Antrian Pekerjaan Sebelum Mengakses Browser

Selaraskan Strategi Proxy, Akun, dan Izin

Bangun Antrian Sebelum Browser Dibuka

Tinjau Akun, Rute, dan Endpoint Bersamaan

Tulis Kebijakan Backoff yang Tidak Bisa Diubah Model

Buka Kembali Lalu Lintas Secara Bertahap Setelah Pendinginan

Kesimpulan

FAQ

Apa log pertama yang harus diperiksa untuk agen yang diblokir?

Apakah agen selalu harus menunggu Retry-After?

Apakah proxy baru bisa memperbaiki pembatasan laju?

Di mana pengendalian kecepatan seharusnya berada?

Kapan CapSolver relevan untuk masalah ini?

Lihat Lebih Banyak

Cara menyelesaikan CAPTCHA dalam agen LlamaIndex

Cara Menyelesaikan CAPTCHA dengan MCP: Model Konteks Protokol Layanan CapSolver

Cara Menyelesaikan reCAPTCHA v3 di OpenAI Agents SDK

Cara menyelesaikan Cloudflare Turnstile dalam Agen CrewAI