
Nikolai Smirnov
Software Development Lead

Ketika asisten AI Anda menjelajahi web di dalam wadah yang aman, CAPTCHA tetap menjadi penghalang utama. Halaman yang dilindungi memblokir agen, formulir tidak dapat dikirim, dan tugas terhenti menunggu intervensi manusia — bahkan ketika agen berjalan dalam sandbox.
NanoClaw adalah kerangka kerja asisten AI yang ringan yang menjalankan agen Claude dalam wadah Linux terisolasi. Setiap agen memiliki sistem file sendiri, browser sendiri, dan alat sendiri — sepenuhnya terpisah dari host dan dari agen lainnya. Namun, seperti otomatisasi browser lainnya, CAPTCHA menghentikan prosesnya.
CapSolver mengubah ini secara total. Dengan memuat ekstensi CapSolver ke dalam browser Chromium di dalam wadah, CAPTCHA diselesaikan secara otomatis dan tidak terlihat di latar belakang. Tidak ada kode. Tidak ada panggilan API dari sisi Anda. Tidak ada perubahan cara Anda berbicara dengan asisten AI Anda.
Bagian terbaiknya? Anda bahkan tidak perlu menyebutkan CAPTCHA kepada AI. Anda hanya perlu memberitahunya untuk menunggu sejenak sebelum mengirimkan — dan ketika ia mengklik Submit, CAPTCHA sudah terselesaikan.
Dan karena NanoClaw menjalankan setiap agen dalam wadahnya sendiri, setiap agen mendapatkan browser terisolasi dengan instansinya sendiri dari CapSolver — tidak ada konflik, tidak ada state yang dibagikan, tidak ada gangguan antar agen.
NanoClaw adalah kerangka kerja asisten AI yang ringan yang dirancang untuk keamanan dan kesederhanaan. Ia menjalankan agen Claude dalam wadah Linux terisolasi — memberikan setiap agen isolasi tingkat OS, bukan hanya pemeriksaan izin tingkat aplikasi.
agent-browser untuk otomatisasi webSetiap container NanoClaw dilengkapi dengan Chromium Debian dan alat CLI agent-browser. Agen dapat:
Bayangkan ini sebagai memberikan setiap agen AI jendela browser terisolasi di dalam sandbox yang terkunci.
CapSolver adalah layanan penyelesaian CAPTCHA yang terkemuka yang menyediakan solusi berbasis AI untuk melewati berbagai tantangan CAPTCHA. Dengan dukungan untuk berbagai jenis CAPTCHA dan waktu respons cepat, CapSolver terintegrasi dengan mulus ke dalam alur kerja otomatis.
Kebanyakan integrasi penyelesaian CAPTCHA membutuhkan Anda menulis kode — membuat panggilan API, memantau hasil, menyisipkan token ke bidang formulir tersembunyi. Itu cara kerjanya dengan alat seperti Crawlee, Puppeteer, atau Playwright.
NanoClaw + CapSolver berbeda secara fundamental:
| Tradisional (Berdasarkan Kode) | NanoClaw (Bahasa Alami) |
|---|---|
Tulis kelas CapSolverService |
Pasang ekstensi ke dalam container |
Panggil createTask() / getTaskResult() |
Cukup berbicara dengan AI Anda |
Sisipkan token melalui page.$eval() |
Ekstensi menangani semuanya |
| Tangani error, ulang, dan timeout dalam kode | Katakan ke AI untuk "tunggu 70 detik, lalu klik Submit" |
| Kode berbeda untuk setiap jenis CAPTCHA | Berfungsi untuk semua jenis secara otomatis |
| State browser yang dibagikan antar tugas | Setiap agen mendapatkan browser terisolasi sendiri |
Pemahaman kunci: Ekstensi Chrome CapSolver berjalan di dalam browser Chromium di dalam container. Ketika agen menavigasi ke halaman dengan CAPTCHA, ekstensi mendeteksinya, menyelesaikannya di latar belakang, dan menyisipkan token — semua sebelum agen bahkan mencoba mengirimkan formulir.
Anda hanya perlu memberinya waktu. Daripada memberi tahu AI "selesaikan CAPTCHA", Anda cukup berkata:
"Pergi ke halaman itu, tunggu 70 detik, lalu klik Submit."
Itu saja. AI tidak perlu tahu tentang CapSolver sama sekali.
Karena NanoClaw menjalankan setiap agen dalam wadahnya sendiri, Anda mendapatkan manfaat unik: setiap agen memiliki instansi Chromium sendiri dengan ekstensi CapSolver sendiri. Ini berarti:
Sebelum mengatur integrasi, pastikan Anda memiliki:
Berita baik: Container NanoClaw menggunakan Chromium Debian (melalui
apt-get install chromium), yang tidak bermerk dan sepenuhnya mendukung flag--load-extension. Berbeda dengan Chrome bermerk 137+, yang secara diam-diam menghapus dukungan pemuatan ekstensi sejak pertengahan 2025, Chromium Debian berjalan langsung.
Anda tidak perlu menginstal Chrome untuk Pengujian, Chromium yang dibundel Playwright, atau browser alternatif apa pun. Chromium yang sudah ada di container Anda sudah cukup.
Unduh ekstensi CapSolver Chrome ke direktori proyek NanoClaw Anda:
CapSolver.Browser.Extension-chrome-vX.X.X.zip terbarumkdir -p assets/capsolver-extension
unzip CapSolver.Browser.Extension-chrome-v*.zip -d assets/capsolver-extension/
ls assets/capsolver-extension/manifest.json
Anda seharusnya melihat manifest.json — ini memastikan ekstensi berada di tempat yang benar.
Buka file konfigurasi ekstensi di assets/capsolver-extension/assets/config.js dan ganti nilai apiKey dengan kunci Anda:
export const defaultConfig = {
apiKey: 'CAP-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX', // ← masukkan kunci Anda di sini
useCapsolver: true,
// ... sisa konfigurasi
};
Anda dapat mendapatkan kunci API dari dashboard CapSolver.
NanoClaw menjalankan agen dalam container Docker. Direktori ekstensi perlu tersedia di dalam container di /opt/capsolver-extension.
Opsi A: Auto-mount via container runner (disarankan)
Tempatkan ekstensi di assets/capsolver-extension/ dalam direktori proyek NanoClaw Anda. Lalu tambahkan volume mount di src/container-runner.ts:
// Pasang ekstensi CapSolver jika tersedia
const capsolverPath = path.join(process.cwd(), 'assets', 'capsolver-extension');
if (fs.existsSync(capsolverPath)) {
mounts.push({
hostPath: capsolverPath,
containerPath: '/opt/capsolver-extension',
readonly: true,
});
}
Opsi B: Bakar ke dalam gambar container
Tambahkan ke container/Dockerfile Anda:
# Tambahkan ekstensi CapSolver
COPY ../assets/capsolver-extension/ /opt/capsolver-extension/
Kemudian rebuild gambar container.
NanoClaw menggunakan alat CLI agent-browser untuk otomatisasi browser di dalam container. Alat ini mendukung pemuatan ekstensi Chrome melalui variabel lingkungan.
Tambahkan variabel lingkungan berikut ke container di src/container-runner.ts:
if (fs.existsSync(capsolverPath)) {
args.push('-e', 'AGENT_BROWSER_EXTENSIONS=/opt/capsolver-extension');
args.push('-e', 'DISPLAY=:99');
args.push('-e', 'AGENT_BROWSER_ARGS=--no-sandbox,--disable-gpu,--disable-blink-features=AutomationControlled,--disable-background-timer-throttling');
args.push('-e', 'AGENT_BROWSER_HEADED=true');
}
| Variabel Lingkungan | Tujuan |
|---|---|
AGENT_BROWSER_EXTENSIONS |
Jalur ke ekstensi CapSolver di dalam container |
DISPLAY |
Tampilan virtual untuk Xvfb (ekstensi membutuhkan konteks tampilan) |
AGENT_BROWSER_ARGS |
Bendera Chrome: tanpa sandbox, anti-deteksi, mencegah penundaan ekstensi |
AGENT_BROWSER_HEADED |
Jalankan dalam mode berbasis GUI (ekstensi bekerja lebih andal) |
Ekstensi Chrome membutuhkan tampilan, bahkan di dalam container. Tambahkan xvfb ke daftar apt-get install di container/Dockerfile dan jalankan secara otomatis di entrypoint:
# Tambahkan xvfb ke daftar apt-get install
RUN apt-get update && apt-get install -y \
chromium \
xvfb \
# ... dependensi lainnya
&& rm -rf /var/lib/apt/lists/*
# Izinkan non-root user menjalankan Xvfb
RUN chmod u+s /usr/bin/Xvfb
# Buat direktori sesi (agent-browser membutuhkannya)
RUN mkdir -p /home/node/.claude/session-env && chown -R node:node /home/node/.claude
Perbarui entrypoint untuk memulai Xvfb secara otomatis:
#!/bin/bash
set -e
# Mulai Xvfb untuk ekstensi browser
if [ -n "$DISPLAY" ]; then
Xvfb $DISPLAY -screen 0 1280x720x24 &
sleep 0.5
fi
# ... sisa entrypoint
# Restart NanoClaw untuk mengambil perubahan
npm run dev
# atau jika dijalankan sebagai layanan:
pm2 restart nanoclaw
Kirim pesan uji ke agen NanoClaw Anda melalui saluran yang terhubung (Discord, WhatsApp, Telegram):
Pergi ke https://www.google.com/recaptcha/api2/demo, tunggu 70 detik,
lalu klik Submit dan beri tahu saya teks apa yang muncul di halaman.
Jika CapSolver berfungsi, agen akan melaporkan: "Verifikasi Berhasil... Hooray!"
Ini adalah bagian yang paling penting. Setelah pemasangan selesai, menggunakan CapSolver dengan NanoClaw adalah sangat sederhana.
Jangan menyebutkan CAPTCHA atau CapSolver kepada AI. Cukup beri waktu sebelum mengirim formulir.
Agen AI tidak perlu tahu tentang CAPTCHA. Ekstensi menangani semuanya di latar belakang. Yang perlu Anda lakukan adalah menyertakan waktu tunggu dalam instruksi Anda sehingga ekstensi punya waktu untuk menyelesaikan tantangan sebelum formulir dikirim.
Kirimkan ini ke agen NanoClaw Anda (melalui Discord, WhatsApp, Telegram, atau saluran lainnya):
Pergi ke https://example.com, tunggu 70 detik,
lalu klik Submit dan beri tahu saya teks apa yang muncul di halaman.
Apa yang terjadi di balik layar:
Pergi ke https://example.com/login, isi kolom email dengan
"me@example.com" dan kolom kata sandi dengan "mypassword123",
lalu tunggu 30 detik dan klik tombol Masuk.
Beritahu saya halaman apa yang muncul setelah masuk.
Buka https://example.com/contact, isi formulir kontak:
- Nama: "John Doe"
- Email: "john@example.com"
- Pesan: "Halo, saya punya pertanyaan tentang layanan Anda."
Tunggu 45 detik, lalu klik Kirim Pesan. Apa konfirmasi yang muncul?
| Jenis CAPTCHA | Waktu Penyelesaian Biasa | Waktu Tunggu yang Direkomendasikan |
|---|---|---|
| reCAPTCHA v2 (checkbox) | 10-30 detik | 60-70 detik |
| reCAPTCHA v2 (invisible) | 5-15 detik | 45 detik |
| reCAPTCHA v3 | 3-10 detik | 30 detik |
| Cloudflare Turnstile | 3-10 detik | 30 detik |
Tips: Jika ragu, gunakan 70 detik. Lebih baik menunggu sedikit lebih lama daripada mengirim terlalu dini. Waktu tambahan tidak memengaruhi hasil. Dalam pengujian kami, 60 detik sedikit berisiko untuk reCAPTCHA v2 — 70 detik bekerja secara andal.
Berikut adalah frasa yang telah terbukti bisa digunakan:
Hindari ini — mereka bisa membingungkan AI atau memicu penolakan:
Untuk yang tertarik secara teknis, berikut ini yang terjadi ketika ekstensi CapSolver dimuat di dalam container NanoClaw:
Pesan Anda Server NanoClaw
───────────────────────────────────────────────────
"pergi ke halaman, ──► Message router menerima pesan
tunggu 60s, kirim" │
▼
Container dibuat untuk agen
┌─────────────────────────────────┐
│ Container Docker Terisolasi │
│ │
│ Agen Claude (melalui Agent SDK) │
│ │ │
│ ▼ │
│ agent-browser: navigasi ke URL │
│ │ │
│ ▼ │
│ Chromium + Ekstensi CapSolver │
│ ┌───────────────────────────┐ │
│ │ Halaman dengan reCAPTCHA │ │
│ │ │ │
│ │ Ekstensi CapSolver: │ │
│ │ 1. Skrip konten mendeteksi │ │
│ │ reCAPTCHA di halaman │ │
│ │ 2. Worker layanan memanggil │ │
│ │ API CapSolver │ │
│ │ 3. Token diterima │ │
│ │ 4. Token dimasukkan ke │ │
│ │ bidang formulir tersembunyi │ │
│ └───────────────────────────┘ │
│ │ │
│ ▼ │
│ Agent menunggu 70 detik... │
│ │ │
│ ▼ │
│ agent-browser: klik Submit │
│ │ │
│ ▼ │
│ "Verifikasi Berhasil!" │
└─────────────────────────────────┘
│
▼
Respons dikirim kembali melalui Discord/WhatsApp/etc.
NanoClaw menggunakan alat CLI agent-browser, yang mendukung pemuatan ekstensi Chrome melalui variabel lingkungan AGENT_BROWSER_EXTENSIONS. Ketika variabel ini diatur, agent-browser secara otomatis meneruskan --load-extension ke Chromium.
AGENT_BROWSER_EXTENSIONS=/opt/capsolver-extension diaturagent-browser open <url> — Chromium berjalan dengan ekstensi yang dimuatKarena NanoClaw menggunakan Chromium Debian (bukan Chrome Google yang bermerk), flag --load-extension bekerja secara andal tanpa perlu penyelesaian. Dan karena agent-browser menangani flag secara internal, Anda tidak perlu mengelola argumen mulai Chrome sendiri.
Gejala: Agent menelusuri dan mengirimkan tetapi CAPTCHAs tidak terselesaikan.
Kemungkinan penyebab:
ls /opt/capsolver-extension/manifest.json di dalam containerAGENT_BROWSER_EXTENSIONS diatur ke /opt/capsolver-extension di containerDISPLAY=:99Gejala: Agent melaporkan "tidak dapat membuat direktori sesi di /home/node/.claude/session-env"
Penyebab: Alat agent-browser membutuhkan direktori sesi yang dapat ditulis. Jika direktori .claude yang dipasang tidak mengandungnya, alat tersebut gagal.
Perbaikan: Pastikan direktori ada di Dockerfile dan di host:
# Di Dockerfile:
RUN mkdir -p /home/node/.claude/session-env && chown -R node:node /home/node/.claude
# Di host (untuk volume yang dipasang):
mkdir -p data/sessions/main/.claude/session-env
chmod -R 777 data/sessions/main/.claude
Kemungkinan penyebab:
Gejala: Chromium crash atau ekstensi tidak berfungsi di dalam container.
Perbaikan: Pastikan Xvfb berjalan sebelum Chromium dimulai:
Xvfb :99 -screen 0 1280x720x24 &
export DISPLAY=:99
Tambahkan ini ke skrip entrypoint container agar berjalan otomatis.
Selain pendekatan ekstensi Chrome, NanoClaw mendukung metode integrasi kedua menggunakan Keterampilan CapSolver — alat CLI Python yang menyelesaikan CAPTCHA melalui API CapSolver secara langsung.
Alih-alih ekstensi menyelesaikan CAPTCHA secara tidak terlihat di latar belakang, agen secara eksplisit:
python3 /opt/capsolver-skills/scripts/solver.pyKlon repo capsolver-skills ke proyek NanoClaw Anda:
git clone https://github.com/capsolver/capsolver-skills.git assets/capsolver-skills
Tambahkan python3 dan dependensinya ke container/Dockerfile Anda:
RUN apt-get update && apt-get install -y python3 python3-pip \
&& pip3 install --break-system-packages requests python-dotenv
Pasang direktori keterampilan dan kirimkan kunci API di src/container-runner.ts:
// Pasang capsolver-skills
const capsolverSkillsPath = path.join(process.cwd(), 'assets', 'capsolver-skills');
if (fs.existsSync(capsolverSkillsPath)) {
mounts.push({
hostPath: capsolverSkillsPath,
containerPath: '/opt/capsolver-skills',
readonly: true,
});
}
// Kirim kunci API
args.push('-e', `API_KEY=${capsolverApiKey}`);
Atur CAPSOLVER_API_KEY di file .env Anda:
CAPSOLVER_API_KEY=CAP-XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
@OpenCrawl Kunjungi https://www.google.com/recaptcha/api2/demo,
gunakan keterampilan capsolver untuk menyelesaikan reCAPTCHA,
kemudian klik Submit dan beri tahu saya hasilnya.
Solver Keterampilan CapSolver mendukung semua jenis CAPTCHA utama melalui CLI:
| Perintah | Jenis CAPTCHA |
|---|---|
ReCaptchaV2TaskProxyLess |
reCAPTCHA v2 |
ReCaptchaV3TaskProxyLess |
reCAPTCHA v3 |
AntiTurnstileTaskProxyLess |
Cloudflare Turnstile |
AntiCloudflareTask |
Cloudflare Challenge |
AntiAwsWafTaskProxyLess |
AWS WAF |
GeeTestTaskProxyLess |
GeeTest v3/v4 |
DatadomeSliderTask |
DataDome |
| Ekstensi Chrome | Keterampilan CapSolver | |
|---|---|---|
| Cara kerjanya | Tidak terlihat, otomatis | Pemanggilan API eksplisit |
| Kesadaran agen | Agen tidak tahu tentang CAPTCHA | Agen secara aktif menyelesaikan CAPTCHA |
| Kompleksitas pemasangan | Pasang ekstensi + atur variabel lingkungan | Pasang skrip Python + instal dependensi |
| Kecepatan | Bergantung pada waktu tunggu | Langsung — tidak perlu menunggu |
| Fleksibilitas | Menangani semua CAPTCHA secara otomatis | Kontrol halus per jenis CAPTCHA |
| Terbaik untuk | Tugas "jelajah dan kirim" sederhana | Alur kerja kompleks yang membutuhkan injeksi token |
Tips: Anda dapat menggunakan kedua metode secara bersamaan. Ekstensi menyelesaikan CAPTCHA secara otomatis di latar belakang, sementara solver keterampilan memberikan kontrol eksplisit kepada agen saat diperlukan.
Waktu tunggu yang lebih lama selalu lebih aman. CAPTCHA biasanya diselesaikan dalam 10-30 detik, tetapi latensi jaringan, tantangan kompleks, atau ulangan dapat menambah waktu. 60-70 detik adalah titik ideal.
Alih-alih:
"Navigasi ke URL, tunggu solver CAPTCHA, lalu kirim"
Gunakan:
"Kunjungi URL, tunggu sekitar satu menit, lalu kirim formulir"
Pengucapan alami bekerja lebih baik dengan AI dan menghindari penolakan keamanan.
Setiap penyelesaian CAPTCHA memakan kredit. Periksa saldo Anda di capsolver.com/dashboard secara teratur untuk menghindari gangguan.
Mount volume ekstensi (daripada menyisipkannya ke dalam gambar) membuatnya mudah diperbarui tanpa merebuild gambar container Anda. Cukup unduh versi baru dan restart NanoClaw.
Integrasi NanoClaw + CapSolver membawa penyelesaian CAPTCHA ke agen AI yang dikemas dalam container — dua cara:
Kedua pendekatan ini telah diverifikasi dan berfungsi. Gunakan ekstensi untuk alur kerja "jelajah dan kirim" sederhana, dan Keterampilan CapSolver ketika Anda membutuhkan kontrol halus.
Dan berkat arsitektur container NanoClaw, setiap agen memiliki browser dan instance CapSolver yang terisolasi — tidak ada konflik, tidak ada state bersama, penyelesaian CAPTCHA multi-agennya benar-benar terisolasi.
Ini yang terlihat saat Anda memiliki asisten AI yang dikemas dalam container: tidak terlihat, otomatis, terisolasi, dan tanpa kode.
Siap mulai? Daftar di CapSolver dan gunakan kode bonus NANOCLAW untuk bonus 6% tambahan pada recharge pertama Anda!
Tidak. Sebenarnya, Anda sebaiknya menghindari menyebutkan CAPTCHA atau CapSolver dalam pesan Anda. Ekstensi bekerja secara tidak terlihat di latar belakang. Cukup sertakan waktu tunggu dalam instruksi Anda (misalnya, "tunggu 70 detik, lalu kirim") untuk memberi ekstensi waktu untuk menyelesaikan CAPTCHA apa pun di halaman.
Container NanoClaw menggunakan Chromium Debian yang diinstal melalui apt-get, yang tidak bermerk. Berbeda dengan Google Chrome 137+ (yang secara diam-diam menghapus dukungan --load-extension di pertengahan 2025), Chromium Debian mendukung pemuatan ekstensi secara penuh. Tidak diperlukan penyelesaian.
CapSolver mendukung reCAPTCHA v2 (checkbox dan tidak terlihat), reCAPTCHA v3, Cloudflare Turnstile, CAPTCHA AWS WAF, dan lainnya. Ekstensi Chrome secara otomatis mendeteksi jenis CAPTCHA dan menyelesaikannya sesuai.
CapSolver menawarkan harga kompetitif berdasarkan jenis CAPTCHA dan volume. Kunjungi capsolver.com untuk harga saat ini. Gunakan kode bonus NANOCLAW untuk bonus 6% tambahan pada recharge pertama Anda.
NanoClaw open-source (lisensi MIT) dan gratis untuk dijalankan di perangkat Anda sendiri. Anda akan membutuhkan kunci API untuk model AI — baik kunci API Anthropic langsung, atau kunci API OpenRouter (yang memberi Anda akses ke Claude dan model lain melalui satu akun). Untuk penyelesaian CAPTCHA, Anda akan membutuhkan akun CapSolver dengan kredit.
Untuk kebanyakan CAPTCHA, 60-70 detik sudah cukup. Waktu penyelesaian sebenarnya biasanya 10-30 detik, tetapi menambahkan buffer tambahan memastikan keandalan. Jika ragu, gunakan 70 detik — dalam pengujian kami, 60 detik terbatas untuk reCAPTCHA v2.
Setiap agen NanoClaw berjalan dalam container Docker terpisah dengan browser Chromium dan instance ekstensi CapSolver sendiri. Ini berarti agen yang berbeda dapat menyelesaikan CAPTCHA secara bersamaan tanpa konflik — tidak ada cookie bersama, tidak ada state browser bersama, tidak ada gangguan. Jika sesi browser satu agen mengalami masalah, itu tidak memengaruhi agen lain.
Ya. Anda akan membutuhkan Xvfb (X Virtual Framebuffer) untuk tampilan karena ekstensi Chrome membutuhkan konteks tampilan. Atur DISPLAY=:99 dan jalankan Xvfb :99 di latar belakang di dalam container.
Ketahui bagaimana Infrastruktur Otomatisasi AI yang didukung LLM mengubah pengenalan CAPTCHA, meningkatkan efisiensi proses bisnis dan mengurangi intervensi manual. Optimalkan operasi otomatis Anda dengan solusi verifikasi canggih.

Pelajari cara meningkatkan pengumpulan data untuk pelatihan LLM dengan menyelesaikan CAPTCHA dalam jumlah besar. Temukan strategi otomatis untuk membangun dataset berkualitas tinggi untuk model AI.
