ProdukIntegrasiSumber DayaDokumentasiHarga
Mulai Sekarang

© 2026 CapSolver. All rights reserved.

Hubungi Kami

Slack: lola@capsolver.com

Produk

  • reCAPTCHA v2
  • reCAPTCHA v3
  • Cloudflare Turnstile
  • Cloudflare Challenge
  • AWS WAF
  • Ekstensi Browser
  • Lebih banyak jenis CAPTCHA

Integrasi

  • Selenium
  • Playwright
  • Puppeteer
  • n8n
  • Mitra
  • Lihat semua integrasi

Sumber Daya

  • Program Referensi
  • Dokumentasi
  • Referensi API
  • Blog
  • FAQ
  • Glosarium
  • Status

Legal

  • Ketentuan Layanan
  • Kebijakan Privasi
  • Kebijakan Pengembalian Dana
  • Jangan jual informasi pribadi saya
//Bagaimana cara berhenti mendapatkan CAPTCHA saat Scraping
Mar03, 2025

Bagaimana cara berhenti mendapatkan CAPTCHA saat Scraping

Ethan Collins

Ethan Collins

Pattern Recognition Specialist

Jika Anda pernah mencoba web scraping, Anda mungkin pernah menemukan CAPTCHA—tes "buktikan Anda manusia" yang menjengkelkan yang memblokir permintaan otomatis. Dalam panduan ini, saya akan membagikan strategi yang dapat ditindaklanjuti untuk meminimalkan gangguan CAPTCHA dan menunjukkan cara mengatasinya ketika muncul. Mari selami!

Mengapa CAPTCHA Muncul Selama Web Scraping? 🤖

CAPTCHA dirancang untuk memblokir bot, yang berarti scraper Anda mungkin ditandai jika:

  • Anda mengirim terlalu banyak permintaan terlalu cepat.
  • Permintaan Anda kurang header browser atau string user-agent yang realistis.
  • Situs web mendeteksi pola IP yang mencurigakan (misalnya, permintaan berulang dari IP yang sama).

Tips Pro: Mulailah dengan meniru perilaku manusia: perlambat permintaan Anda, putar user agent, dan gunakan proxy. Tetapi jika CAPTCHA masih muncul, Anda memerlukan solusi yang lebih kuat.


Cara Memecahkan CAPTCHA Secara Otomatis Menggunakan CAPTCHA Solver

Ketika penghindaran tidak cukup, layanan seperti Capsolver dapat mengotomatiskan pemecahan CAPTCHA. Begini cara kerjanya:

Contoh: Memecahkan reCAPTCHA v2 dengan Python

python Copy
# pip install requests
import requests
import time

api_key = "YOUR_API_KEY"  # Ganti dengan kunci Capsolver Anda
site_key = ""  # Dari situs target
site_url = ""  # URL target Anda

def solve_captcha():
    payload = {
        "clientKey": api_key,
        "task": {
            "type": "ReCaptchaV2TaskProxyLess",
            "websiteKey": site_key,
            "websiteURL": site_url
        }
    }
    response = requests.post("https://api.capsolver.com/createTask", json=payload)
    task_id = response.json().get("taskId")
    
    # Ambil hasilnya
    while True:
        time.sleep(3)
        result = requests.post("https://api.capsolver.com/getTaskResult", json={"clientKey": api_key, "taskId": task_id})
        status = result.json().get("status")
        if status == "ready":
            return result.json()["solution"]["gRecaptchaResponse"]
        elif status == "failed":
            print("Gagal memecahkan CAPTCHA")
            return None

captcha_token = solve_captcha()
print(f"Token CAPTCHA yang telah dipecahkan: {captcha_token}")

Cara kerjanya:

  1. API Capsolver membuat tugas untuk memecahkan CAPTCHA di situs target Anda.
  2. Ini mengembalikan token yang dapat Anda masukkan ke dalam scraper Anda untuk melewati CAPTCHA.

Kesulitan dengan kegagalan berulang untuk sepenuhnya memecahkan captcha saat melakukan webscraping?

Klaim Kode Bonus Anda untuk solusi captcha terbaik -CapSolver: CAPTCHA. Setelah menukarkannya, Anda akan mendapatkan bonus tambahan 5% setelah setiap pengisian ulang, Tidak Terbatas

Scraping Tanpa CAPTCHA: Contoh yang Lebih Sederhana

Tidak semua situs menggunakan CAPTCHA. Mari kita scrape books.toscrape.com, sandbox bebas CAPTCHA:

python Copy
import requests
from bs4 import BeautifulSoup

url = "http://books.toscrape.com/"
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")

# Ekstrak judul dan harga buku
for book in soup.select("article.product_pod"):
    title = book.h3.a["title"]
    price = book.select(".price_color")[0].get_text()
    print(f"Judul: {title}, Harga: {price}")

Mengapa ini berhasil:
Situs ini tidak memiliki tindakan anti-bot, tetapi selalu periksa robots.txt situs web sebelum melakukan scraping.


Mengidentifikasi Jenis dan Parameter CAPTCHA 🔍

Sebelum memecahkan CAPTCHA, Anda perlu mengetahui jenisnya (misalnya, reCAPTCHA v2, hCaptcha). Gunakan alat seperti Panduan Identifikasi CAPTCHA Capsolver untuk:

  1. Mendeteksi penyedia CAPTCHA.
  2. Temukan parameter yang diperlukan seperti sitekey atau pageurl.

Contoh parameter untuk reCAPTCHA v2:

  • websiteKey: "6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_mJ-"
  • websiteURL: URL halaman target Anda.

Praktik Terbaik untuk Menghindari CAPTCHA Sama Sekali

  1. Perlambat: Tambahkan penundaan antara permintaan dengan time.sleep().
  2. Putar proxy: Gunakan layanan seperti Nst Proxy untuk menghindari larangan IP.
  3. Gunakan header yang realistis: Tiru User-Agent dan Accept-Language browser.

FAQ: Menangani CAPTCHA Selama Scraping

1. Bagaimana cara kerja CAPTCHA solver?

Mereka menggunakan campuran AI dan pekerja manusia untuk memecahkan CAPTCHA dan mengembalikan token untuk otomatisasi.

2. Dapatkah semua CAPTCHA diotomatiskan?

Sebagian besar jenis umum (reCAPTCHA, hCaptcha) dapat dipecahkan, tetapi yang canggih memerlukan metode yang lebih canggih.

4. Apa cara termudah untuk menghindari CAPTCHA?

  • Gunakan browser tanpa kepala seperti Puppeteer atau Playwright untuk mensimulasikan interaksi manusia
  • Gunakan proxy seluler
  • Gunakan versi user-agent terbaru
  • Gunakan klien TLS
  • Gunakan header yang tepat / urutan header dari versi user-agent

Pikiran Akhir

CAPTCHA adalah rintangan, tetapi bukan jalan buntu. Gabungkan praktik scraping yang cerdas dengan alat seperti Capsolver untuk meminimalkan gangguan. Selamat scraping! 🚀

Lihat Lebih Banyak

n8nMar 09, 2026

Cara Menyelesaikan reCAPTCHA v2/v3 Menggunakan CapSolver dan n8n

Bangun API solver eCAPTCHA v2/v3 menggunakan CapSolver dan n8n. Pelajari cara mengotomatisasi penyelesaian token, mengirimkannya ke website, dan mengekstrak data yang dilindungi tanpa coding.

Emma Foster
Emma Foster
Apr 22, 2026

Terbaik AI untuk Menyelesaikan Teka-Teki Gambar: Alat dan Strategi Teratas untuk 2026

Temukan AI terbaik untuk menyelesaikan teka-teki gambar. Pelajari bagaimana Engine Visi CapSolver dan API ImageToText mengotomasi tantangan visual kompleks dengan akurasi tinggi.

Daftar Isi

Emma Foster
Emma Foster
web scrapingApr 22, 2026

Arsitektur Pengambilan Data Web Rust untuk Ekstraksi Data yang Dapat Diskalakan

Pelajari arsitektur pengambilan data web Rust yang dapat diskalakan dengan reqwest, scraper, pengambilan data asinkron, pengambilan data browser tanpa tampilan, rotasi proxy, dan penanganan CAPTCHA yang sesuai aturan.

Emma Foster
Emma Foster
Apr 22, 2026

Search API vs Rantai Pasok Pengetahuan: Panduan Infrastruktur Data Kecerdasan Buatan

Pelajari bagaimana alat API pencarian, rantai pasok pengetahuan, alur kerja API SERP, dan pipa data AI membentuk infrastruktur data web modern untuk AI.

Emma Foster
Emma Foster
Blog
All