CAPSOLVER
Blog
Menggunakan Playwright dengan Ruby: Panduan Langkah demi Langkah untuk 2024

Menggunakan Playwright dengan Ruby: Panduan Langkah Demi Langkah untuk 2024

Logo of Capsolver

Lucas Mitchell

Automation Engineer

02-Sep-2024

Menggunakan Playwright dengan Ruby: Panduan Langkah demi Langkah untuk 2024

Web scraping telah menjadi keterampilan penting bagi pengembang yang perlu mengumpulkan data dari situs web. Playwright, alat otomatisasi browser yang ampuh, sering digunakan untuk tujuan ini. Dalam panduan ini, kita akan menjelajahi cara menggunakan Playwright dengan Ruby untuk mengikis data dari situs web. Kita akan menelusuri contoh praktis menggunakan situs web Quotes to Scrape.

Prasyarat

Sebelum kita mulai, pastikan Anda telah menginstal hal-hal berikut di mesin Anda:

  • Ruby (Versi 2.7 atau yang lebih baru)
  • Node.js (Playwright membutuhkan Node.js untuk berjalan)
  • Playwright Gem (Pembungkus Ruby untuk Playwright)

Anda dapat menginstal dependensi yang diperlukan dengan menjalankan:

gem install playwright-ruby-client

Menyiapkan Playwright

Setelah menginstal permata playwright-ruby-client, Anda perlu menyiapkan Playwright di skrip Ruby Anda. Berikut cara melakukannya:

require 'playwright'

Playwright.create(playwright_cli_executable_path: '/path/to/node_modules/.bin/playwright') do |playwright|
  browser = playwright.chromium.launch(headless: false)
  page = browser.new_page
  page.goto('http://quotes.toscrape.com/')
  
  # Kode scraping contoh akan masuk di sini
  
  browser.close
end

Ganti '/path/to/node_modules/.bin/playwright' dengan jalur sebenarnya ke Playwright CLI di sistem Anda.

Mengikis Kutipan dari Situs Web

Sekarang, mari tulis kode untuk mengikis kutipan dari situs web. Kita akan mengekstrak teks dari setiap kutipan dan penulis yang sesuai.

require 'playwright'

Playwright.create(playwright_cli_executable_path: '/path/to/node_modules/.bin/playwright') do |playwright|
  browser = playwright.chromium.launch(headless: false)
  page = browser.new_page
  page.goto('http://quotes.toscrape.com/')
  
  quotes = page.query_selector_all('.quote')

  quotes.each do |quote|
quote_text = quote.query_selector('.text').text_content.strip
author = quote.query_selector('.author').text_content.strip
puts "#{quote_text} - #{author}"
end

browser.close
end

Panduan ini telah menunjukkan kepada Anda cara menyiapkan Playwright dengan Ruby dan mengambil data dari situs web. Contoh yang digunakan di sini sederhana tetapi dapat diperluas untuk tugas yang lebih kompleks. Kemampuan Playwright untuk mengotomatiskan tugas browser menjadikannya alat yang ampuh untuk pengambilan data web dan pengujian.

Selamat mengambil data!

Lebih lanjut

Cara Menggunakan Hrequests untuk Web Scraping
Cara Menggunakan Hrequests untuk Web Scraping

Pelajari cara mengikis situs web secara efisien menggunakan hrequests dengan proxy dan penanganan captcha, termasuk demo tentang menyelesaikan ReCaptcha V2 dengan Capsolver untuk melewati tantangan dan mengekstrak data dengan lancar.

Logo of Capsolver

Lucas Mitchell

04-Sep-2024

Cara Menggunakan ScrapeGraph AI untuk Web Scraping
Cara Menggunakan ScrapeGraph AI untuk Scraping Web

Pelajari cara menggunakan ScrapeGraph AI, perpustakaan scraping web Python yang kuat, untuk mengekstrak data dari situs web dan dokumen lokal dengan mudah. Panduan ini mencakup contoh untuk menggunakan OpenAI dan model lokal seperti Ollama, dan cara menangani captcha dengan Capsolver.

Logo of Capsolver

Rajinder Singh

04-Sep-2024

Memecahkan Tantangan reCAPTCHA v3 Enterprise dengan Python dan Selenium
Memecahkan Tantangan reCAPTCHA v3 Enterprise dengan Python dan Selenium

Cara menyelesaikan tantangan reCAPTCHA v3 Enterprise menggunakan Python dan Selenium, alat otomatisasi browser yang populer.

reCAPTCHA
Logo of Capsolver

Ethan Collins

04-Sep-2024

Cara Cepat dan Mudah untuk Menyelesaikan reCAPTCHA dengan Cepat
Cara Cepat dan Mudah untuk Menyelesaikan reCAPTCHA dengan Cepat

Jelajahi beberapa metode cepat dan mudah untuk menyelesaikan reCAPTCHA dengan cepat

reCAPTCHA
Logo of Capsolver

Ethan Collins

02-Sep-2024

Menggunakan Playwright dengan Ruby: Panduan Langkah demi Langkah untuk 2024
Menggunakan Playwright dengan Ruby: Panduan Langkah Demi Langkah untuk 2024

Pelajari cara menangani tantangan CAPTCHA saat web scraping dengan Playwright dan Ruby. Panduan lengkap untuk 2024 ini mencakup integrasi mudah dengan CapSolver melalui ekstensi atau API, memastikan ekstraksi data yang lancar dari situs web dengan perlindungan CAPTCHA.

Logo of Capsolver

Lucas Mitchell

02-Sep-2024

Mengerti reCaptcha v2 Tantangan Tak Terlihat: Identifikasi dan Parameter
Memecahkan Tantangan Invisible reCaptcha v2: Identifikasi dan Parameter

Menghadapi tantangan dengan reCaptcha v2 Invisible? Pasti kamu ingin tahu cara mengidentifikasi versinya dan parameternya, dan menyelesaikannya secara efektif

reCAPTCHA
Logo of Capsolver

Ethan Collins

29-Aug-2024