CAPSOLVER
Blog
Menggunakan Playwright dengan Ruby: Panduan Langkah demi Langkah untuk 2024

Menggunakan Playwright dengan Ruby: Panduan Langkah Demi Langkah untuk 2024

Logo of CapSolver

Lucas Mitchell

Automation Engineer

02-Sep-2024

Menggunakan Playwright dengan Ruby: Panduan Langkah demi Langkah untuk 2024

Web scraping telah menjadi keterampilan penting bagi pengembang yang perlu mengumpulkan data dari situs web. Playwright, alat otomatisasi browser yang ampuh, sering digunakan untuk tujuan ini. Dalam panduan ini, kita akan menjelajahi cara menggunakan Playwright dengan Ruby untuk mengikis data dari situs web. Kita akan menelusuri contoh praktis menggunakan situs web Quotes to Scrape.

Prasyarat

Sebelum kita mulai, pastikan Anda telah menginstal hal-hal berikut di mesin Anda:

  • Ruby (Versi 2.7 atau yang lebih baru)
  • Node.js (Playwright membutuhkan Node.js untuk berjalan)
  • Playwright Gem (Pembungkus Ruby untuk Playwright)

Anda dapat menginstal dependensi yang diperlukan dengan menjalankan:

bash Copy
gem install playwright-ruby-client

Menyiapkan Playwright

Setelah menginstal permata playwright-ruby-client, Anda perlu menyiapkan Playwright di skrip Ruby Anda. Berikut cara melakukannya:

ruby Copy
require 'playwright'

Playwright.create(playwright_cli_executable_path: '/path/to/node_modules/.bin/playwright') do |playwright|
  browser = playwright.chromium.launch(headless: false)
  page = browser.new_page
  page.goto('http://quotes.toscrape.com/')
  
  # Kode scraping contoh akan masuk di sini
  
  browser.close
end

Ganti '/path/to/node_modules/.bin/playwright' dengan jalur sebenarnya ke Playwright CLI di sistem Anda.

Mengikis Kutipan dari Situs Web

Sekarang, mari tulis kode untuk mengikis kutipan dari situs web. Kita akan mengekstrak teks dari setiap kutipan dan penulis yang sesuai.

ruby Copy
require 'playwright'

Playwright.create(playwright_cli_executable_path: '/path/to/node_modules/.bin/playwright') do |playwright|
  browser = playwright.chromium.launch(headless: false)
  page = browser.new_page
  page.goto('http://quotes.toscrape.com/')
  
  quotes = page.query_selector_all('.quote')

  quotes.each do |quote|
ruby Copy
quote_text = quote.query_selector('.text').text_content.strip
author = quote.query_selector('.author').text_content.strip
puts "#{quote_text} - #{author}"
end

browser.close
end

Panduan ini telah menunjukkan kepada Anda cara menyiapkan Playwright dengan Ruby dan mengambil data dari situs web. Contoh yang digunakan di sini sederhana tetapi dapat diperluas untuk tugas yang lebih kompleks. Kemampuan Playwright untuk mengotomatiskan tugas browser menjadikannya alat yang ampuh untuk pengambilan data web dan pengujian.

Selamat mengambil data!

Pernyataan Kepatuhan: Informasi yang diberikan di blog ini hanya untuk tujuan informasi. CapSolver berkomitmen untuk mematuhi semua hukum dan peraturan yang berlaku. Penggunaan jaringan CapSolver untuk kegiatan ilegal, penipuan, atau penyalahgunaan sangat dilarang dan akan diselidiki. Solusi penyelesaian captcha kami meningkatkan pengalaman pengguna sambil memastikan kepatuhan 100% dalam membantu menyelesaikan kesulitan captcha selama pengambilan data publik. Kami mendorong penggunaan layanan kami secara bertanggung jawab. Untuk informasi lebih lanjut, silakan kunjungi Syarat Layanan dan Kebijakan Privasi.

Lebih lanjut

Kesalahan Cloudflare 1006, 1007, 1008
Solusi Penyelesaian Error Cloudflare 1006, 1007, 1008 | Cara Mengatasi

Kesulitan dengan kesalahan Cloudflare 1006, 1007, atau 1008? Pelajari solusi praktis untuk menyelesaikan penolakan akses ini dan tingkatkan pengalaman crawling web Anda.

Cloudflare
Logo of CapSolver

Emma Foster

05-Dec-2025

AI-LLM: Solusi Masa Depan untuk Pengendalian Risiko Pengenalan Gambar dan Penyelesaian CAPTCHA
AI-LLM: Solusi Masa Depan untuk Pengendalian Risiko Pengenalan Gambar dan Penyelesaian CAPTCHA

Penjelajahan mendalam tentang bagaimana Model Bahasa Besar (MB) mengubah pemecahan CAPTCHA grafis, menggabungkan penalaran zero-shot dengan presisi CNN untuk pengendalian risiko modern.

Logo of CapSolver

Lucas Mitchell

05-Dec-2025

Cara Mengatasi Captchas Saat Scrapping Web dengan Scrapling dan CapSolver
Cara Menyelesaikan Captchas Ketika Web Scraping dengan Scrapling dan CapSolver

Scrapling + CapSolver memungkinkan pengambilan data otomatis dengan ReCaptcha v2/v3 dan Cloudflare Turnstile bypass.

web scraping
Logo of CapSolver

Adélia Cruz

05-Dec-2025

Ubah User-Agent di Selenium
Ubah User-Agent di Selenium | Langkah-langkah & Praktik Terbaik

Mengganti User Agent di Selenium adalah langkah penting untuk banyak tugas pengambilan data web. Ini membantu menyamarkan skrip otomasi sebagai browser biasa...

The other captcha
Logo of CapSolver

Aloísio Vítor

05-Dec-2025

Cara Mengidentifikasi Apakah `action` Diperlukan untuk Menyelesaikan Cloudflare Turnstile Menggunakan Ekstensi CapSolver
Cara mengidentifikasi apakah `action` diperlukan untuk mengatasi Cloudflare Turnstile menggunakan ekstensi CapSolver

Pelajari cara mengidentifikasi tindakan untuk penyelesaian CAPTCHA yang efektif Cloudflare Turnstile. Ikuti panduan langkah demi langkah kami dalam menggunakan alat dan teknik Capsolver.

Cloudflare
Logo of CapSolver

Anh Tuan

05-Dec-2025

9proxy
Temukan Kekuatan 9Proxy: Ulasan Komprehensif

Dalam artikel ini, kami akan menunjukkan apa itu 9proxy dan layanan yang mereka tawarkan.

Partners
Logo of CapSolver

Rajinder Singh

04-Dec-2025