CAPSOLVER
Blog
Cara Menggunakan Axios untuk Web Scraping

Cara Menggunakan Axios untuk Web Scraping

Logo of CapSolver

Emma Foster

Machine Learning Engineer

23-Sep-2024

Apa itu Axios?

Axios adalah pustaka JavaScript populer yang digunakan untuk melakukan permintaan HTTP dari browser dan Node.js. Ini menyederhanakan pembuatan permintaan HTTP asinkron dan memungkinkan Anda untuk menangani respons dengan mudah menggunakan janji.

Fitur:

  • Berdasarkan Janji: Menggunakan janji JavaScript, membuatnya lebih mudah untuk mengelola operasi asinkron.
  • Dukungan Browser dan Node.js: Berfungsi dengan lancar di kedua lingkungan.
  • Parsing JSON Otomatis: Secara otomatis memparsing respons JSON.
  • Interceptor: Mendukung interceptor permintaan dan respons untuk mengelola permintaan dan menangani respons secara global.
  • Penanganan Kesalahan: Menyediakan mekanisme bawaan untuk menangani kesalahan.

Prasyarat

Sebelum menggunakan Axios, pastikan Anda memiliki:

  • Node.js diinstal untuk penggunaan sisi server.
  • npm atau yarn untuk menginstal paket.

Instalasi

Anda dapat menginstal Axios menggunakan npm atau yarn:

bash Copy
npm install axios

atau

bash Copy
yarn add axios

Contoh Dasar: Membuat Permintaan GET

Berikut cara melakukan permintaan GET sederhana menggunakan Axios:

javascript Copy
const axios = require('axios');

axios.get('https://httpbin.org/get')
  .then(response => {
    console.log('Kode Status:', response.status);
    console.log('Tubuh Respons:', response.data);
  })
  .catch(error => {
    console.error('Kesalahan:', error);
  });

Contoh Web Scraping: Mengambil Data JSON dari API

Mari kita ambil data dari API dan cetak hasilnya:

javascript Copy
const axios = require('axios');

axios.get('https://jsonplaceholder.typicode.com/posts')
  .then(response => {
    const posts = response.data;
    posts.forEach(post => {
      console.log(`${post.title} — ${post.body}`);
    });
  })
  .catch(error => {
    console.error('Kesalahan:', error);
  });

Menangani Captcha dengan CapSolver dan Axios

Di bagian ini, kita akan mengintegrasikan CapSolver dengan Axios untuk melewati captcha. CapSolver menyediakan API untuk menyelesaikan captcha seperti ReCaptcha V3 dan captcha.

Kita akan mendemonstrasikan pemecahan ReCaptcha V3 dengan CapSolver dan menggunakan solusinya dalam permintaan.

Contoh: Memecahkan ReCaptcha V3 dengan CapSolver dan Axios

Pertama, instal Axios dan CapSolver:

bash Copy
npm install axios
npm install capsolver

Sekarang, berikut cara memecahkan ReCaptcha V3 dan menggunakan solusinya dalam permintaan Anda:

javascript Copy
const axios = require('axios');
const CAPSOLVER_KEY = 'YourKey';
const PAGE_URL = 'https://antcpt.com/score_detector';
const PAGE_KEY = '6LcR_okUAAAAAPYrPe-HK_0RULO1aZM15ENyM-Mf';
const PAGE_ACTION = 'homepage';

async function createTask(url, key, pageAction) {
  try {
    const apiUrl = 'https://api.capsolver.com/createTask';
    const payload = {
      clientKey: CAPSOLVER_KEY,
      task: {
        type: 'ReCaptchaV3TaskProxyLess',
        websiteURL: url,
        websiteKey: key,
        pageAction: pageAction
      }
    };
    const headers = {
      'Content-Type': 'application/json',
    };
    const response = await axios.post(apiUrl, payload, { headers });
    return response.data.taskId;

  } catch (error) {
    console.error('Kesalahan membuat tugas CAPTCHA:', error);
    throw error;
  }
}

async function getTaskResult(taskId) {
  try {
    const apiUrl = 'https://api.capsolver.com/getTaskResult';
    const payload = {
      clientKey: CAPSOLVER_KEY,
      taskId: taskId,
    };
    const headers = {
      'Content-Type': 'application/json',
    };
    let result;
    do {
      const response = await axios.post(apiUrl, payload, { headers });
      result = response.data;
      if (result.status === 'ready') {
        return result.solution;
      }
      await new Promise(resolve => setTimeout(resolve, 5000)); // tunggu 5 detik sebelum mencoba lagi
    } while (true);

  } catch (error) {
    console.error('Kesalahan mendapatkan hasil CAPTCHA:', error);
    throw error;
  }
}

function setSessionHeaders() {
  return {
    'cache-control': 'max-age=0',
    'sec-ch-ua': '"Not/A)Brand";v="99", "Google Chrome";v="107", "Chromium";v="107"',
    'sec-ch-ua-mobile': '?0',
    'sec-ch-ua-platform': 'Windows',
    'upgrade-insecure-requests': '1',
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36',
    'accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7',
    'sec-fetch-site': 'same-origin',
    'sec-fetch-mode': 'navigate',
    'sec-fetch-user': '?1',
    'sec-fetch-dest': 'document',
    'accept-encoding': 'gzip, deflate',
    'accept-language': 'en,fr-FR;q=0.9,fr;q=0.8,en-US;q=0.7',
  };
}

async function main() {
  const headers = setSessionHeaders();
  console.log('Membuat tugas CAPTCHA...');
  const taskId = await createTask(PAGE_URL, PAGE_KEY, PAGE_ACTION);
  console.log(`ID Tugas: ${taskId}`);

  console.log('Mengambil hasil CAPTCHA...');
  const solution = await getTaskResult(taskId);
  const token = solution.gRecaptchaResponse;
  console.log(`Solusi Token: ${token}`);

  const res = await axios.post('https://antcpt.com/score_detector/verify.php', { 'g-recaptcha-response': token }, { headers });
  const response = res.data;
  console.log(`Skor: ${response.score}`);
}

main().catch(err => {
  console.error(err);
});

Menangani Proxy dengan Axios

Untuk mengarahkan permintaan Anda melalui proxy dengan Axios:

javascript Copy
const axios = require('axios');

axios.get('https://httpbin.org/ip', {
  proxy: {
    host: 'proxyserver',
    port: 8080,
    auth: {
      username: 'username',
      password: 'password'
    }
  }
})
  .then(response => {
    console.log('Tubuh Respons:', response.data);
  })
  .catch(error => {
    console.error('Kesalahan:', error);
  });

Anda dapat menangani cookie di Axios menggunakan opsi withCredentials:

javascript Copy
const axios = require('axios');

axios.get('https://httpbin.org/cookies/set?name=value', { withCredentials: true })
  .then(response => {
    console.log('Cookie:', response.headers['set-cookie']);
  })
  .catch(error => {
    console.error('Kesalahan:', error);
  });

Penggunaan Lanjutan: Header Kustom dan Permintaan POST

Anda dapat mengirimkan header kustom dan melakukan permintaan POST dengan Axios:

javascript Copy
const axios = require('axios');

const headers = {
  'User-Agent': 'Mozilla/5.0 (compatible)',
  'Accept-Language': 'en-US,en;q=0.5',
};

const data = {
  username: 'testuser',
  password: 'testpass',
};

axios.post('https://httpbin.org/post', data, { headers })
  .then(response => {
    console.log('Respons JSON:', response.data);
  })
  .catch(error => {
    console.error('Kesalahan:', error);
  });

Kesimpulan

Dengan Axios, Anda dapat dengan mudah mengelola permintaan HTTP di lingkungan Node.js dan browser. Dengan mengintegrasikannya dengan CapSolver, Anda dapat melewati captcha seperti ReCaptcha V3 dan captcha, memungkinkan akses ke konten terbatas.

Pernyataan Kepatuhan: Informasi yang diberikan di blog ini hanya untuk tujuan informasi. CapSolver berkomitmen untuk mematuhi semua hukum dan peraturan yang berlaku. Penggunaan jaringan CapSolver untuk kegiatan ilegal, penipuan, atau penyalahgunaan sangat dilarang dan akan diselidiki. Solusi penyelesaian captcha kami meningkatkan pengalaman pengguna sambil memastikan kepatuhan 100% dalam membantu menyelesaikan kesulitan captcha selama pengambilan data publik. Kami mendorong penggunaan layanan kami secara bertanggung jawab. Untuk informasi lebih lanjut, silakan kunjungi Syarat Layanan dan Kebijakan Privasi.

Lebih lanjut

Pengenalan Gambar Berbasis AI: Dasar-Dasar dan Cara Mengatasinya
Pengenalan Gambar Berbasis AI: Dasar-Dasar dan Cara Mengatasinya

Ucapkan selamat tinggal pada kesulitan CAPTCHA gambar – CapSolver Vision Engine menyelesaikannya dengan cepat, cerdas, dan tanpa kerumitan!

Logo of CapSolver

Ethan Collins

25-Apr-2025

Agen Pengguna Terbaik untuk Web Scraping & Cara Menggunakannya
Agen Pengguna Terbaik untuk Web Scraping & Cara Menggunakannya

Panduan untuk user agent terbaik untuk web scraping dan penggunaan efektifnya untuk menghindari deteksi. Jelajahi pentingnya user agent, jenis-jenisnya, dan cara mengimplementasikannya untuk web scraping yang lancar dan tidak terdeteksi.

Logo of CapSolver

Ethan Collins

07-Mar-2025

Sidik Jari TLS Cloudflare: Apa Itu dan Cara Mengatasinya
Sidik Jari TLS Cloudflare: Apa Itu dan Cara Mengatasinya

Pelajari tentang penggunaan TLS fingerprinting Cloudflare untuk keamanan, bagaimana cara mendeteksi dan memblokir bot, dan jelajahi metode efektif untuk mengatasinya dalam tugas web scraping dan penelusuran otomatis.

Cloudflare
Logo of CapSolver

Ethan Collins

28-Feb-2025

Mengapa saya terus diminta untuk memverifikasi bahwa saya bukan robot?
Mengapa saya terus diminta untuk memverifikasi bahwa saya bukan robot?

Pelajari mengapa Google meminta Anda untuk memverifikasi bahwa Anda bukan robot dan jelajahi solusi seperti menggunakan API CapSolver untuk menyelesaikan tantangan CAPTCHA secara efisien.

Logo of CapSolver

Ethan Collins

27-Feb-2025

Mengapa Situs Web Mengira Saya Bot? Dan Cara Mengatasinya
Mengapa Situs Web Mengira Saya Bot? Dan Cara Mengatasinya

Pahami mengapa situs web menandai Anda sebagai bot dan cara menghindari deteksi. Pemicu utama meliputi tantangan CAPTCHA, IP yang mencurigakan, dan perilaku browser yang tidak biasa.

Logo of CapSolver

Ethan Collins

20-Feb-2025

Cara Mengekstrak Data dari Situs Web yang Dilindungi Cloudflare
Cara Mengestrak Data dari Situs Web yang Dilindungi Cloudflare

Dalam panduan ini, kita akan mengeksplorasi teknik etis dan efektif untuk mengekstrak data dari situs web yang dilindungi Cloudflare.

Cloudflare
Logo of CapSolver

Ethan Collins

20-Feb-2025