ProdukIntegrasiSumber DayaDokumentasiHarga
Mulai Sekarang

© 2026 CapSolver. All rights reserved.

Hubungi Kami

Slack: lola@capsolver.com

Produk

  • reCAPTCHA v2
  • reCAPTCHA v3
  • Cloudflare Turnstile
  • Cloudflare Challenge
  • AWS WAF
  • Ekstensi Browser
  • Lebih banyak jenis CAPTCHA

Integrasi

  • Selenium
  • Playwright
  • Puppeteer
  • n8n
  • Mitra
  • Lihat semua integrasi

Sumber Daya

  • Program Referensi
  • Dokumentasi
  • Referensi API
  • Blog
  • FAQ
  • Glosarium
  • Status

Legal

  • Ketentuan Layanan
  • Kebijakan Privasi
  • Kebijakan Pengembalian Dana
  • Jangan jual informasi pribadi saya
Blog/All/Cara Memecahkan CAPTCHA Gambar dalam Web Scraping: Panduan Lengkap untuk 2025
Jan24, 2025

Cara Memecahkan CAPTCHA Gambar dalam Web Scraping: Panduan Lengkap untuk 2025

Adélia Cruz

Adélia Cruz

Neural Network Developer

Jika ada satu hal yang telah saya pelajari selama bertahun-tahun sebagai penggemar web scraping, itu adalah tantangan CAPTCHA seperti penjaga gerbang internet. Pertemuan pertama saya dengan CAPTCHA gambar terasa seperti menabrak tembok bata. Saya telah menghabiskan berjam-jam membangun scraper saya, dan tepat ketika saya akan memanen data, saya disambut dengan foto-foto lampu lalu lintas, penyeberangan, dan etalase toko yang buram. Saya menyadari saat itu bahwa memecahkan CAPTCHA gambar bukan hanya tantangan teknis—itu adalah ritual bagi setiap scraper web yang serius.

Sekarang, di tahun 2025, CAPTCHA gambar telah berevolusi menjadi mekanisme yang canggih, menggunakan AI untuk menggagalkan bahkan scraper paling canggih sekalipun. Tetapi dengan alat, teknik, dan pola pikir yang tepat, mereka tidak lagi tak teratasi. Di blog ini, saya akan berbagi apa yang telah saya pelajari tentang memecahkan CAPTCHA gambar secara efektif, dari pengalaman pribadi hingga solusi terbaru.

Apa itu CAPTCHA Gambar dan Mengapa Mereka Ada?

Saat melakukan web scraping, salah satu jenis CAPTCHA yang paling umum dijumpai adalah CAPTCHA gambar, yang dirancang untuk mencegah bot otomatis mengakses situs web. Dengan kemajuan teknologi, sistem CAPTCHA terus berkembang dan menjadi lebih kompleks. Salah satu sistem CAPTCHA gambar yang paling banyak dijumpai adalah reCAPTCHA Google.

reCAPTCHA meminta pengguna untuk memilih gambar yang berisi objek tertentu, seperti lampu lalu lintas, sepeda, atau penyeberangan. Jenis tantangan pengenalan gambar ini sangat efektif dalam membedakan antara pengguna manusia dan skrip otomatis. Meskipun kotak centang "Saya bukan robot" dulunya adalah standar, versi terbaru mengandalkan tantangan berbasis gambar, yang semakin umum. Pengguna diharuskan untuk memilih gambar yang benar untuk menyelesaikan verifikasi dan membuktikan bahwa mereka bukan bot.

Jenis CAPTCHA Gambar Umum dalam Web Scraping

Dalam dunia web scraping, CAPTCHA gambar bukan hanya hambatan; mereka adalah tantangan canggih yang dirancang untuk membedakan antara manusia dan bot. Di antara banyak varian, dua hal menonjol sebagai yang paling sering dijumpai: reCAPTCHA Google dan CAPTCHA ImageToText. Setiap jenis menghadirkan rintangan unik, tetapi dengan pendekatan yang tepat, mereka dapat dipecahkan secara efektif.

1. Memecahkan Tantangan reCAPTCHA v2

Langkah 1: Mengimpor Pustaka yang Diperlukan

Pertama, kita perlu mengimpor pustaka requests, yang memungkinkan kita untuk membuat permintaan HTTP untuk berinteraksi dengan API CapSolver.

python Copy
import requests

Langkah 2: Mendefinisikan URL API dan Kunci API

Untuk berkomunikasi dengan API CapSolver, Anda perlu memberikan kunci API. Kunci ini biasanya dibuat saat Anda mendaftar akun dengan CapSolver. Di sini, kita mendefinisikan API_URL untuk menentukan titik akhir API dan API_KEY untuk mengautentikasi akun Anda.

python Copy
API_URL = "https://api.capsolver.com/createTask"
API_KEY = "YOUR_API_KEY"

Langkah 3: Membuat Payload Permintaan

Payload adalah kamus yang berisi semua informasi yang diperlukan untuk permintaan tersebut. Dalam hal ini, kita menentukan jenis CAPTCHA (ReCaptchaV2Classification), URL situs web target, dan objek yang akan dikenali (misalnya, lampu lalu lintas). Pastikan untuk mengganti URL situs web target dan objek yang akan dikenali dengan nilai sebenarnya untuk kasus Anda.

python Copy
payload = {
    "clientKey": API_KEY,  # Ganti dengan kunci API Anda
    "task": {
        "type": "ReCaptchaV2Classification",  # tipe reCAPTCHA v2
        "websiteURL": "https://target-website.com",  # URL situs web target
        "question": "/m/04_sv"  # Objek yang akan dikenali (misalnya, lampu lalu lintas)
    }
}

Langkah 4: Mengirim Permintaan

Kita menggunakan requests.post untuk mengirim permintaan, meneruskan payload yang telah dibuat sebagai data JSON. Objek response akan berisi data respons API.

python Copy
response = requests.post(API_URL, json=payload)

Langkah 5: Menangani Respons

Periksa kode status respons untuk memastikan permintaan berhasil. Jika berhasil, kita mengurai respons JSON dan memeriksa errorId dan status untuk melihat apakah solusinya sudah siap. Jika tantangan telah terpecahkan, kita mengekstrak dan menampilkan solusinya.

python Copy
if response.status_code == 200:
    result = response.json()
    if result.get("errorId") == 0 and result.get("status") == "ready":
        print("Solution:", result["solution"])  # Output solusi
    else:
        print("Error:", result.get("errorDescription"))  # Output pesan kesalahan
else:
    print(f"Failed with status code: {response.status_code}")  # Jika permintaan gagal, output kode status

2. Memecahkan CAPTCHA ImageToText

Langkah 1: Mengimpor Pustaka yang Diperlukan

Di sini, kita menggunakan pustaka capsolver, yang disediakan oleh CapSolver untuk berinteraksi dengan API mereka. Kita juga mengimpor os dan pathlib untuk mengelola jalur file untuk gambar CAPTCHA.

python Copy
import os
from pathlib import Path
import capsolver

Langkah 2: Mengatur Kunci API Anda

Seperti halnya reCAPTCHA, pertama-tama kita mengatur kunci API Anda untuk autentikasi dengan layanan CapSolver.

python Copy
capsolver.api_key = "YOUR_API_KEY"

Langkah 3: Menentukan Jalur Gambar CAPTCHA

Anggaplah Anda telah mengunduh gambar CAPTCHA dan menyimpannya secara lokal. Kita menggunakan pathlib untuk menentukan jalur file ke gambar tersebut.

python Copy
# Dapatkan jalur ke direktori skrip saat ini dan tentukan jalur file gambar CAPTCHA
img_path = os.path.join(Path(__file__).resolve().parent, "captcha_image.jpg")

Langkah 4: Membaca dan Mengkode Gambar

Selanjutnya, kita membuka file gambar CAPTCHA dalam mode biner dan mengkodekannya ke base64, yang diperlukan untuk mengirimkannya ke CapSolver untuk diproses.

python Copy
with open(img_path, 'rb') as f:
    encoded_image = f.read().encode("base64")  # Encode gambar ke base64

Langkah 5: Mengajukan Tugas dan Mendapatkan Solusi

Sekarang, kita memanggil capsolver.solve() untuk mengajukan tugas CAPTCHA ImageToText, meneruskan gambar yang telah dienkode base64 sebagai bagian dari permintaan. Kita menentukan jenis tugas sebagai ImageToTextTask dan menggunakan modul OCR general untuk pengenalan teks.

python Copy
solution = capsolver.solve({
    "type": "ImageToTextTask",  # Tetapkan jenis tugas ke ImageToText
    "module": "general",  # Gunakan modul OCR umum
    "body": encoded_image  # Lewatkan gambar yang telah dienkode base64
})

Langkah 6: Output Solusi

Terakhir, kita mengeluarkan solusi CAPTCHA yang didekode yang dikembalikan oleh CapSolver.

python Copy
print("CAPTCHA Solution:", solution)

Kode Bonus

Klaim Kode Bonus Anda untuk solusi captcha teratas; CapSolver: recapv2. Setelah menukarkannya, Anda akan mendapatkan bonus tambahan 5% setelah setiap pengisian ulang, Tidak Terbatas.


Kesimpulan

Dengan mengikuti langkah-langkah ini, Anda dapat dengan mudah memecahkan dua jenis CAPTCHA gambar umum: reCAPTCHA Google dan CAPTCHA ImageToText. Baik Anda berurusan dengan reCAPTCHAs yang dibuat secara dinamis atau tantangan teks yang terdistorsi, API CapSolver menyediakan solusi yang efisien dan otomatis.

Metode ini akan secara signifikan meningkatkan efisiensi dan keandalan tugas web scraping Anda. Seperti biasa, pastikan bahwa aktivitas scraping Anda mematuhi standar hukum dan etika untuk menjaga integritas pekerjaan Anda.

Di tahun 2025, memecahkan CAPTCHA bukan hanya keterampilan—itu adalah kebutuhan bagi setiap scraper yang ingin tetap unggul dalam permainan.

Lihat Lebih Banyak

May 06, 2026

Cara Menyelesaikan Tantangan AWS WAF Tanpa Browser: Panduan Teknis

Pelajari cara menyelesaikan tantangan AWS WAF dan CAPTCHA tanpa menggunakan browser. Gunakan API CapSolver untuk menghasilkan token dan mengelak kode status 405.

Emma Foster
Emma Foster
Apr 30, 2026

Web Scraping di Linux: Alat, Pengaturan & Panduan Praktis

Bangun pengambilan data web di Linux dengan Python, proxies, dan penanganan CAPTCHA. Panduan pengembang praktis yang mencakup Scrapy, Playwright, CapSolver, dan pipa data.

Emma Foster
Emma Foster

Daftar Isi

Apr 30, 2026

Kesalahan Cloudflare 1020: Akses Ditolak dalam Web Scraping & Perlindungan WAF

Pelajari apa yang memicu Kesalahan Cloudflare 1020 Akses Ditolak, bagaimana Firewall Aplikasi Web dan deteksi bot bekerja, dan bagaimana pengembang dapat mengurangi kesalahan positif dalam alur kerja otomatis yang sah.

Emma Foster
Emma Foster
Apr 29, 2026

Ekstensi Pemecah CAPTCHA Otomatis Terbaik untuk Chrome pada 2026

Temukan ekstensi Chrome solver CAPTCHA otomatis terbaik pada 2026. Bandingkan CapSolver NopeCHA dan SolveCaptcha berdasarkan kecepatan jenis yang didukung dan privasi untuk menemukan yang sesuai.

Emma Foster
Emma Foster