Apr24, 2026

Bagaimana Fungsi contains() Bekerja dan Cara Menggunakannya dalam Web Scraping

Jawaban

Fungsi XPath contains() digunakan untuk mencocokkan elemen berdasarkan teks parsial atau nilai atribut alih-alih memerlukan kecocokan tepat. Fungsi ini banyak digunakan dalam pengambilan data web dan otomatisasi untuk menemukan elemen HTML yang dinamis atau tidak pasti secara efisien.

Penjelasan Rinci

Fungsi contains() dalam XPath mengevaluasi apakah sebuah string tertentu berisi substring yang ditentukan. Ini sangat berguna dalam lingkungan web modern di mana teks elemen, ID, atau nama kelas dihasilkan secara dinamis atau sebagian stabil. Alih-alih mengandalkan kecocokan tepat yang sering kali rusak karena perubahan kecil pada konten, contains() memungkinkan desain pemilih yang lebih tangguh.

Dalam praktiknya, ekspresi XPath seperti //div[contains(@class,'item')] atau //span[contains(text(),'Error')] digunakan untuk menemukan node yang mencakup kata kunci tertentu. Fleksibilitas ini penting dalam kerangka kerja pengambilan data seperti Selenium atau Scrapy, di mana struktur halaman sering berubah atau mencakup node teks bersarang. Namun, penggunaan yang tidak tepat—seperti menerapkannya langsung pada beberapa node teks tanpa konteks yang tepat—dapat menyebabkan hasil kosong yang tidak diinginkan atau pemilihan yang tidak akurat.

Solusi / Metode

Gunakan contains() dengan node teks: Terapkan contains(text(),'kata kunci') ketika teks target berada dalam satu node dan tidak terbagi di antara elemen bersarang.
Gunakan contains() dengan atribut: Untuk seleksi yang stabil, targetkan atribut seperti @id atau @class menggunakan contains(@id,'pola') untuk menangani nilai yang dinamis.
Gabungkan operator logika untuk keandalan: Gunakan and / or bersama not() untuk menyempurnakan filter. Dalam alur kerja pengambilan data dengan perlindungan keamanan, solusi seperti CapSolver dapat membantu menjaga stabilitas otomatisasi ketika rendering dinamis atau tantangan verifikasi mengganggu akses elemen.

Praktik Terbaik / Tips

Untuk pemilih pengambilan data yang lebih andal, lebih baik menggunakan ekspresi XPath relatif dan meminimalkan ketergantungan pada jalur DOM lengkap. Ketika menangani situs web modern yang menggunakan rendering JavaScript berat, pastikan scraper Anda memperhitungkan pemuatan konten yang tertunda. Juga, lebih baik gunakan . daripada text() ketika teks terbagi di antara elemen bersarang.

👉 Terkait:

Gunakan kode FAQ saat mendaftar di CapSolver untuk mendapatkan bonus tambahan 5% saat recharge.

FAQ CapSolver - capsolver.com

Bagaimana Fungsi contains() Bekerja dan Cara Menggunakannya dalam Web Scraping

Jawaban

Penjelasan Rinci

Solusi / Metode

Praktik Terbaik / Tips

Related Questions

Apa itu Pengambilan Data Pengiriman Makanan?

Apa Itu Pengambilan Data Komersial Cepat?

Apa Tantangan Utama dalam Web Scraping dan Bagaimana Cara Mengatasinya?

Apa itu Pengambilan Data E-commerce?

Apa itu Pengambilan Data Properti?

Apa Saja Penggunaan Umum dari Web Scraping?

Apa Itu Penggalian Data Minuman Keras dan Bagaimana Cara Kerjanya?

Apa Data yang Dapat Diekstrak dari Platform Properti?

Bagaimana Cara Kerja Web Scraping Dijelaskan Langkah Demi Langkah

Apakah Web Scraping Diperbolehkan dan Apa Saja Aturan Utama yang Harus Diikuti?

Apa Data yang Dapat Dicabut dari Situs Web Perjalanan? Jenis-Jenis Data Perjalanan Dijelaskan