Sản phẩmTích hợpTài nguyênTài liệuGiá cả
Bắt đầu ngay

© 2026 CapSolver. All rights reserved.

Liên hệ chúng tôi

Slack: lola@capsolver.com

Sản phẩm

  • reCAPTCHA v2
  • reCAPTCHA v3
  • Cloudflare Turnstile
  • Cloudflare Challenge
  • AWS WAF
  • Tiện ích trình duyệt
  • Thêm nhiều loại CAPTCHA

Tích hợp

  • Selenium
  • Playwright
  • Puppeteer
  • n8n
  • Đối tác
  • Xem tất cả tích hợp

Tài nguyên

  • Chương trình giới thiệu
  • Tài liệu
  • Tham chiếu API
  • Blog
  • Câu hỏi thường gặp
  • Thuật ngữ
  • Trạng thái

Pháp lý

  • Điều khoản dịch vụ
  • Chính sách bảo mật
  • Chính sách hoàn tiền
  • Không bán thông tin cá nhân của tôi
Blog/All/Sử dụng Playwright với Ruby: Hướng dẫn từng bước cho năm 2024
Sep03, 2024

Sử dụng Playwright với Ruby: Hướng dẫn từng bước cho năm 2024

Lucas Mitchell

Lucas Mitchell

Automation Engineer

Sử dụng Playwright với Ruby: Hướng dẫn từng bước cho năm 2024

Web scraping đã trở thành một kỹ năng cần thiết cho các nhà phát triển cần thu thập dữ liệu từ các trang web. Playwright, một công cụ tự động hóa trình duyệt mạnh mẽ, thường được sử dụng cho mục đích này. Trong hướng dẫn này, chúng ta sẽ khám phá cách sử dụng Playwright với Ruby để trích xuất dữ liệu từ một trang web. Chúng ta sẽ đi qua một ví dụ thực tế bằng cách sử dụng trang web Quotes to Scrape.

Điều kiện tiên quyết

Trước khi bắt đầu, hãy đảm bảo rằng bạn đã cài đặt những thứ sau trên máy của mình:

  • Ruby (Phiên bản 2.7 trở lên)
  • Node.js (Playwright yêu cầu Node.js để chạy)
  • Playwright Gem (Bao bọc Ruby cho Playwright)

Bạn có thể cài đặt các phụ thuộc cần thiết bằng cách chạy:

bash Copy
gem install playwright-ruby-client

Cài đặt Playwright

Sau khi cài đặt gem playwright-ruby-client, bạn cần thiết lập Playwright trong tập lệnh Ruby của mình. Đây là cách bạn có thể làm điều đó:

ruby Copy
require 'playwright'

Playwright.create(playwright_cli_executable_path: '/path/to/node_modules/.bin/playwright') do |playwright|
  browser = playwright.chromium.launch(headless: false)
  page = browser.new_page
  page.goto('http://quotes.toscrape.com/')
  
  # Mã trích xuất ví dụ sẽ được đưa vào đây
  
  browser.close
end

Thay thế '/path/to/node_modules/.bin/playwright' bằng đường dẫn thực tế đến Playwright CLI trên hệ thống của bạn.

Trích xuất Trích dẫn từ Trang web

Bây giờ, hãy viết mã để trích xuất trích dẫn từ trang web. Chúng ta sẽ trích xuất văn bản của mỗi trích dẫn và tác giả tương ứng.

ruby Copy
require 'playwright'

Playwright.create(playwright_cli_executable_path: '/path/to/node_modules/.bin/playwright') do |playwright|
  browser = playwright.chromium.launch(headless: false)
  page = browser.new_page
  page.goto('http://quotes.toscrape.com/')
  
  quotes = page.query_selector_all('.quote')

  quotes.each do |quote|
ruby Copy
require 'playwright'

Playwright.create do |playwright|
  browser = playwright.chromium.launch
  page = browser.new_page

  page.goto('http://quotes.toscrape.com/')

  page.query_selector_all('.quote').each do |quote|
    quote_text = quote.query_selector('.text').text_content.strip
    author = quote.query_selector('.author').text_content.strip
    puts "#{quote_text} - #{author}"
  end

  browser.close
end

Hướng dẫn này đã chỉ cho bạn cách thiết lập Playwright với Ruby và trích xuất dữ liệu từ một trang web. Ví dụ được sử dụng ở đây rất đơn giản nhưng có thể được mở rộng cho các tác vụ phức tạp hơn. Khả năng tự động hóa các tác vụ trình duyệt của Playwright biến nó thành một công cụ mạnh mẽ để trích xuất dữ liệu web và kiểm tra.

Chúc bạn trích xuất dữ liệu vui vẻ!

Xem thêm

Apr 30, 2026

Lỗi 1020 của Cloudflare: Truy cập bị từ chối trong trích xuất dữ liệu web & Bảo vệ WAF

Hãy học cách xác định nguyên nhân gây ra lỗi Cloudflare 1020 Truy cập Bị Từ Chối, cách Tường lửa Ứng dụng Web và phát hiện bot hoạt động, và cách các nhà phát triển giảm thiểu kết quả dương tính giả trong các quy trình tự động hợp lệ.

Anh Tuan
Anh Tuan
Apr 29, 2026

Theo dõi Giá Sản Phẩm Được Bảo Vệ Bằng AWS WAF Trong n8n Với CapSolver

Học cách sử dụng mẫu CapSolver n8n để theo dõi các trang sản phẩm được bảo vệ bởi AWS WAF, giải quyết các thách thức, trích xuất giá cả, so sánh các thay đổi và kích hoạt cảnh báo tự động.

Anh Tuan

Nội dung

Anh Tuan
Apr 29, 2026

Các tác nhân AI trong SEO: Từ nghiên cứu từ khóa đến thu thập dữ liệu tự động

Học cách các tác nhân AI trong SEO tự động hóa nghiên cứu từ khóa, phân tích đối thủ cạnh tranh và thu thập dữ liệu – và cách xử lý các thách thức CAPTCHA trong quy trình của bạn với CapSolver.

Anh Tuan
Anh Tuan
Apr 29, 2026

Tài liệu API Giải quyết CAPTCHA cho Nhà phát triển: Hướng dẫn năm 2026

Nâng cao kỹ năng giải CAPTCHA với tài liệu API toàn diện dành cho nhà phát triển của chúng tôi. Học cách tích hợp CapSolver để xử lý reCAPTCHA, AWS WAF và nhiều hơn nữa.

Anh Tuan
Anh Tuan
Dùng thử miễn phí