
Lucas Mitchell
Automation Engineer
वेब स्क्र्यापिङ वेबसाइटहरूबाट डेटा सङ्कलन गर्नुपर्ने विकासकर्ताहरूको लागि एउटा महत्त्वपूर्ण सीप भएको छ। प्लेराइट, एउटा शक्तिशाली ब्राउजर स्वचालन उपकरण, प्रायः यस उद्देश्यको लागि प्रयोग गरिन्छ। यस गाइडमा, हामी वेबसाइटबाट डेटा स्क्र्याप गर्न रूबीसँग प्लेराइट प्रयोग गर्ने तरिका अन्वेषण गर्नेछौँ। हामी उद्धरणहरू स्क्र्याप गर्न वेबसाइट प्रयोग गरेर व्यावहारिक उदाहरणमार्फत हिँड्नेछौँ।
हामी सुरु गर्नु अघि, तपाईँको मेसिनमा निम्न स्थापना भएको सुनिश्चित गर्नुहोस्:
तपाईँ निम्न चलाएर आवश्यक निर्भरताहरू स्थापना गर्न सक्नुहुन्छ:
gem install playwright-ruby-client
playwright-ruby-client जेम स्थापना गरेपछि, तपाईँको रूबी स्क्रिप्टमा प्लेराइट सेट अप गर्नुपर्छ। तपाईँ यो कसरी गर्न सक्नुहुन्छ भनेर यहाँ छ:
require 'playwright'
Playwright.create(playwright_cli_executable_path: '/path/to/node_modules/.bin/playwright') do |playwright|
browser = playwright.chromium.launch(headless: false)
page = browser.new_page
page.goto('http://quotes.toscrape.com/')
# उदाहरण स्क्र्यापिङ कोड यहाँ जानेछ
browser.close
end
तपाईँको प्रणालीमा प्लेराइट सीएलआईको वास्तविक बाटोसँग '/path/to/node_modules/.bin/playwright' प्रतिस्थापन गर्नुहोस्।
अब, वेबसाइटबाट उद्धरणहरू स्क्र्याप गर्न कोड लेखौँ। हामी प्रत्येक उद्धरणको पाठ र सम्बन्धित लेखक निकाल्नेछौँ।
require 'playwright'
Playwright.create(playwright_cli_executable_path: '/path/to/node_modules/.bin/playwright') do |playwright|
browser = playwright.chromium.launch(headless: false)
page = browser.new_page
page.goto('http://quotes.toscrape.com/')
quotes = page.query_selector_all('.quote')
quotes.each do |quote|
quote_text = quote.query_selector('.text').text_content.strip
author = quote.query_selector('.author').text_content.strip
puts "#{quote_text} - #{author}"
end
browser.close
end
यह गाइड आपको दिखाता है कि कैसे Playwright को Ruby के साथ सेट करें और किसी वेबसाइट से डेटा स्क्रैप करें। यहाँ इस्तेमाल किया गया उदाहरण सरल है लेकिन इसे और अधिक जटिल कार्यों के लिए विस्तारित किया जा सकता है। ब्राउज़र कार्यों को स्वचालित करने की Playwright की क्षमता इसे वेब स्क्रैपिंग और परीक्षण के लिए एक शक्तिशाली उपकरण बनाती है।
खुश स्क्रैपिंग!
सीखें कैसे कैपसॉल्वर n8n टेम्पलेट का उपयोग AWS WAF-सुरक्षित उत्पाद पृष्ठों को मॉनिटर करने, चुनौतियां हल करने, मूल्य निकालने, परिवर्तनों की तुलना करने और स्वचालित रूप से चेतावनियां ट्रिगर करने के लिए करें।

सीओ में एआई एजेंट्स कीवर्ड रिसर्च, प्रतिद्वंद्वी विश्लेषण और डेटा संग्रह को स्वचालित कैसे करते हैं — और आपके पाइपलाइन में CAPTCHA चुनौतियों के साथ निपटें कैसे हैं। CapSolver के साथ
