Menggunakan Playwright dengan Ruby: Panduan Langkah Demi Langkah untuk 2024

Lucas Mitchell
Automation Engineer
02-Sep-2024
Menggunakan Playwright dengan Ruby: Panduan Langkah demi Langkah untuk 2024
Web scraping telah menjadi keterampilan penting bagi pengembang yang perlu mengumpulkan data dari situs web. Playwright, alat otomatisasi browser yang ampuh, sering digunakan untuk tujuan ini. Dalam panduan ini, kita akan menjelajahi cara menggunakan Playwright dengan Ruby untuk mengikis data dari situs web. Kita akan menelusuri contoh praktis menggunakan situs web Quotes to Scrape.
Prasyarat
Sebelum kita mulai, pastikan Anda telah menginstal hal-hal berikut di mesin Anda:
- Ruby (Versi 2.7 atau yang lebih baru)
- Node.js (Playwright membutuhkan Node.js untuk berjalan)
- Playwright Gem (Pembungkus Ruby untuk Playwright)
Anda dapat menginstal dependensi yang diperlukan dengan menjalankan:
bash
gem install playwright-ruby-client
Menyiapkan Playwright
Setelah menginstal permata playwright-ruby-client, Anda perlu menyiapkan Playwright di skrip Ruby Anda. Berikut cara melakukannya:
ruby
require 'playwright'
Playwright.create(playwright_cli_executable_path: '/path/to/node_modules/.bin/playwright') do |playwright|
browser = playwright.chromium.launch(headless: false)
page = browser.new_page
page.goto('http://quotes.toscrape.com/')
# Kode scraping contoh akan masuk di sini
browser.close
end
Ganti '/path/to/node_modules/.bin/playwright' dengan jalur sebenarnya ke Playwright CLI di sistem Anda.
Mengikis Kutipan dari Situs Web
Sekarang, mari tulis kode untuk mengikis kutipan dari situs web. Kita akan mengekstrak teks dari setiap kutipan dan penulis yang sesuai.
ruby
require 'playwright'
Playwright.create(playwright_cli_executable_path: '/path/to/node_modules/.bin/playwright') do |playwright|
browser = playwright.chromium.launch(headless: false)
page = browser.new_page
page.goto('http://quotes.toscrape.com/')
quotes = page.query_selector_all('.quote')
quotes.each do |quote|
ruby
quote_text = quote.query_selector('.text').text_content.strip
author = quote.query_selector('.author').text_content.strip
puts "#{quote_text} - #{author}"
end
browser.close
end
Panduan ini telah menunjukkan kepada Anda cara menyiapkan Playwright dengan Ruby dan mengambil data dari situs web. Contoh yang digunakan di sini sederhana tetapi dapat diperluas untuk tugas yang lebih kompleks. Kemampuan Playwright untuk mengotomatiskan tugas browser menjadikannya alat yang ampuh untuk pengambilan data web dan pengujian.
Selamat mengambil data!
Pernyataan Kepatuhan: Informasi yang diberikan di blog ini hanya untuk tujuan informasi. CapSolver berkomitmen untuk mematuhi semua hukum dan peraturan yang berlaku. Penggunaan jaringan CapSolver untuk kegiatan ilegal, penipuan, atau penyalahgunaan sangat dilarang dan akan diselidiki. Solusi penyelesaian captcha kami meningkatkan pengalaman pengguna sambil memastikan kepatuhan 100% dalam membantu menyelesaikan kesulitan captcha selama pengambilan data publik. Kami mendorong penggunaan layanan kami secara bertanggung jawab. Untuk informasi lebih lanjut, silakan kunjungi Syarat Layanan dan Kebijakan Privasi.
Lebih lanjut

Penggunaan Browser vs Browserbase: Manakah Alat Otomatisasi Browser yang Lebih Baik untuk Agen AI?
Bandingkan Penggunaan Browser dengan Browserbase untuk otomatisasi agen AI. Jelajahi fitur, harga, dan cara menyelesaikan CAPTCHA dengan CapSolver untuk alur kerja yang mulus.

Anh Tuan
26-Jan-2026

Larangan IP pada 2026: Bagaimana Cara Kerjanya dan Cara Praktis untuk Mengelaknya
Pelajari cara menghindari pembatasan IP pada 2026 dengan panduan lengkap kami. Temukan teknik pemblokiran IP modern dan solusi praktis seperti proxy residensial dan solver CAPTCHA.

Emma Foster
26-Jan-2026

Cara Menyelesaikan Captcha di Maxun dengan Integrasi CapSolver
Panduan praktis untuk mengintegrasikan CapSolver dengan Maxun dalam penggunaan nyata pengambilan data web. Pelajari cara mengelola reCAPTCHA, Cloudflare Turnstile, dan situs yang dilindungi CAPTCHA dengan menggunakan alur kerja pre-auth dan robot.

Adélia Cruz
21-Jan-2026

Cara menyelesaikan Captcha di Browser4 dengan integrasi CapSolver
Otomasi Browser4 dengan throughput tinggi dikombinasikan dengan CapSolver untuk menangani tantangan CAPTCHA dalam ekstraksi data web skala besar.

Anh Tuan
21-Jan-2026

Alat Ekstraksi Data Terbaik untuk 2026 (Perbandingan Lengkap)
Temukan alat ekstraksi data terbaik untuk 2026. Bandingkan platform terkemuka web scraping, ETL, dan berbasis AI untuk mengotomatisasi pengumpulan data dan alur kerja AI Anda.

Emma Foster
21-Jan-2026

Menyelesaikan Captcha Tanpa Batas dengan Pemecah Captcha Terbaik
Pelajari cara menyelesaikan Captcha tak terbatas dengan lancar menggunakan solver Captcha terbaik, panduan rinci tentang mengatur dan mengotomasi solusi Captcha secara efektif

Adélia Cruz
20-Jan-2026

