CAPSOLVER
Blog
Jak rozwiązać Captcha DataDome

Jak rozwiązać Captcha DataDome

Logo of Capsolver

Rajinder Singh

Deep Learning Researcher

03-Jul-2023

Co to jest DataDome?

CAPTCHA DataDome to jedno z narzędzi używanych przez DataDome do odróżniania użytkowników od botów. CAPTCHA, jak wspomniano wcześniej, oznacza „Całkowicie zautomatyzowany publiczny test Turinga, aby odróżnić komputery od ludzi”. Jest to test zaprojektowany tak, aby był łatwy do przejścia dla ludzi, ale trudny dla botów.
Gdy system DataDome wykryje podejrzaną aktywność, która może sugerować działanie bota, może wywołać test CAPTCHA. Użytkownik musi następnie pomyślnie wypełnić CAPTCHA, aby udowodnić, że jest człowiekiem, a nie botem.
Wyzwanie CAPTCHA DataDome może wyglądać mniej więcej tak:

Jak rozwiązać DataDome Captcha

Zanim zaczniemy rozwiązywać problemy z DataDome, musimy poznać pewne wymagania i punkty, o których musimy wiedzieć
Wymagania:

  • Klucz Capsolvera
  • Serwer proxy

Uwagi, aby pamiętać, że jeśli nie zastosujesz się do rozwiązania, będzie ono nieważne:

  • Parametry zapytania url captcha są uzyskiwane dynamicznie. Oznacza to, że nie możesz wielokrotnie przesyłać statycznego adresu URL captcha.
    Parametry zapytania to pogrubione słowa: https://geo.captcha-delivery.com/captcha/?initialCid=yourInitialCid&cid=yourCid&t=fe&* * referer **=https%3A%2F%2Fantoinevastel.com%2Fbots%2Fdatadome&s=YourSParam&e=youreParam są one uzyskiwane w pierwszym GET, w którym otrzymujesz captcha

  • Parametr zapytania t musi mieć wartość t=fe, jeśli ma t=bv, oznacza to, że captchaUrl jest zablokowany i nie możesz nam tego wysłać.

  • Dopasuj TLS wersji chrome, nagłówek i kolejność nagłówków.

  • Dopasuj serwer proxy użyty do rozwiązania captcha w celu interakcji ze stroną

    Aby rozwiązać captcha, musisz najpierw przesłać wszystkie wymagane informacje. Upewnij się, że rozumiesz wszystkie punkty, aby upewnić się, że capsolver może poprawnie rozwiązać captcha.

Aby rozwiązać problem captcha datadome, postępuj zgodnie z naszą dokumentacją. Niektóre parametry są obowiązkowe, a niektóre opcjonalne. W tym przykładzie użyjemy tylko niezbędnych parametrów. Typy zadań dla kopuły danych to:

  • DatadomeSliderTask: Ten typ zadania wymaga własnych serwerów proxy.

W tym przykładzie użyjemy DatadomeSliderTask, ponieważ witryna używa captcha datadome.
Jeśli brakuje jakichkolwiek parametrów, prawdopodobnie napotkasz problemy z nieakceptowaniem tokena przez witrynę.
Pierwszą metodą, której musisz użyć z dokumentacji, jest createTask, ta metoda wymaga parametrów obrazu, niektóre są obowiązkowe, a niektóre opcjonalne, zależy to od strony, której chcemy użyć.

Krok 1: Wysyłanie informacji do capsolver

Użyj metody createTask, aby wysłać informacje:

POST https://api.capsolver.com/createTask
{
"clientKey": "Sua_API_KEY",
"task": {
"type": "DatadomeSliderTask",
"websiteURL": "https://antoinevastel.com/bots/datadome",
"captchaUrl": "https://geo.captcha-delivery.com/captcha/?initialCid=seuInitialCid&cid=seuCid&t=fe&referer=https%3A%2F%2Fantoinevastel.com%2Fbots%2Fdatadome&s=SeuSParam&e=seuEParam",
"proxy": "seuproxy",
"userAgent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36"
 }
}

Krok 2: Uzyskanie wyników

Aby zweryfikować wyniki, będziesz musiał stale sondować punkt końcowy API getTaskResult, dopóki captcha nie zostanie rozwiązany.
Oto przykładowa prośba:

POST https://api.capsolver.com/getTaskResult
Host: api.capsolver.com
Content-Type: application/json
{
 "clientKey":"SUA_API_KEY",
 "taskId": "ID_DA_TAREFA_DO_CREATETASK" //ID criado pelo método createTask
}

Gdy captcha jest pomyślnie rozwiązany, otrzymasz odpowiedź podobną do tej przedstawionej na poniższym obrazku:

Otrzymany token captcha można zweryfikować wysyłając plik cookie datadome z wartością odpowiedzi do odpowiedniej witryny.

⚠️ Jeśli token zostanie odrzucony, może to oznaczać, że brakuje niektórych informacji lub są one nieprawidłowe. Upewnij się, że TLS jest poprawny (użyto klienta użytkownika zgodnego z TLS, dobre nagłówki, poprawna kolejność nagłówków i ten sam serwer proxy użyty do rozwiązania captcha)

Podsumowując, chociaż rozwiązanie captcha datadome może wydawać się zniechęcającym zadaniem, capsolver.com sprawia, że ​​proces ten jest szybki i wydajny. Wykonując powyższe kroki, możesz łatwo rozwiązać problemy z datadome.

Zespół Capsolver 💜

More

Solving 403 Forbidden Errors When Crawling Websites with Python
Solving 403 Forbidden Errors When Crawling Websites with Python

Learn how to overcome 403 Forbidden errors when crawling websites with Python. This guide covers IP rotation, user-agent spoofing, request throttling, authentication handling, and using headless browsers to bypass access restrictions and continue web scraping successfully.

The other captcha
Logo of Capsolver

Sora Fujimoto

01-Aug-2024

How to Use Selenium Driverless for Efficient Web Scraping
How to Use Selenium Driverless for Efficient Web Scraping

Learn how to use Selenium Driverless for efficient web scraping. This guide provides step-by-step instructions on setting up your environment, writing your first Selenium Driverless script, and handling dynamic content. Streamline your web scraping tasks by avoiding the complexities of traditional WebDriver management, making your data extraction process simpler, faster, and more portable.

The other captcha
Logo of Capsolver

Lucas Mitchell

01-Aug-2024

Scrapy vs. Selenium
Scrapy vs. Selenium: What's Best for Your Web Scraping Project

Discover the strengths and differences between Scrapy and Selenium for web scraping. Learn which tool suits your project best and how to handle challenges like CAPTCHAs.

The other captcha
Logo of Capsolver

Ethan Collins

24-Jul-2024

API vs Scraping
API vs Scraping : the best way to obtain the data

Understand the differences, pros, and cons of Web Scraping and API Scraping to choose the best data collection method. Explore CapSolver for bot challenge solutions.

The other captcha
Logo of Capsolver

Ethan Collins

15-Jul-2024

How to solve CAPTCHA With Selenium C#
How to solve CAPTCHA With Selenium C#

At the end of this tutorial, you'll have a solid understanding of How to solve CAPTCHA With Selenium C#

The other captcha
Logo of Capsolver

Rajinder Singh

10-Jul-2024

What is puppeteer
What is puppeteer and how to use in web scraping | Complete Guide 2024

This complete guide will delve into what Puppeteer is and how to effectively use it in web scraping.

The other captcha
Logo of Capsolver

Lucas Mitchell

09-Jul-2024