CAPSOLVER
Blog
Comment résoudre le captcha DataDome

Comment résoudre le captcha DataDome

Logo of Capsolver

Ethan Collins

Pattern Recognition Specialist

05-Jun-2023

Comment résoudre le captcha DataDome

Comment résoudre le captcha DataDome

Qu'est-ce que DataDome ?

Le CAPTCHA de DataDome est l'un des outils que DataDome utilise pour différencier les utilisateurs humains et les bots. CAPTCHA, comme mentionné précédemment, signifie "Completely Automated Public Turing test to tell Computers and Humans Apart" (Test de Turing public entièrement automatisé pour différencier les ordinateurs et les humains). C'est un test conçu pour être facile à passer pour les humains mais difficile pour les bots.

Lorsque le système de DataDome détecte une activité suspecte qui pourrait suggérer un bot, il peut déclencher un défi CAPTCHA. L'utilisateur doit alors réussir le CAPTCHA pour prouver qu'il est humain et non un bot.

Un défi CAPTCHA de DataDome pourrait ressembler à cette représentation :

Dans cette représentation, l'utilisateur est présenté avec une image CAPTCHA et un bouton curseur que l'utilisateur doit compléter le puzzle. Une fois le CAPTCHA réussi, l'utilisateur peut accéder au site web. S'ils échouent ou si le CAPTCHA n'est pas complété, le système peut refuser l'accès ou présenter un autre défi CAPTCHA.

En résumé, DataDome est une solution complète de protection contre les bots qui utilise l'IA et l'apprentissage automatique pour identifier et bloquer les activités de bots nuisibles. Son défi CAPTCHA est l'un des outils qu'il utilise pour vérifier si un utilisateur est un humain ou un bot, contribuant à maintenir la sécurité et l'intégrité des sites web qu'il protège.

Dans ce blog, nous nous concentrerons sur la résolution du captcha Datadome.

Comment résoudre le captcha DataDome

Avant de commencer à résoudre DataDome, il y a quelques exigences et points dont nous devons être conscients
et points que nous devons connaître :
Exigences :

  • Clé Capsolver
  • Proxy (Recommandé https://www.nstproxy.com/)

Points à prendre en compte si vous ne suivez pas, la solution sera invalide :

  • Les paramètres de requête de l'URL du captcha sont obtenus de manière dynamique. Cela signifie que vous ne pouvez pas envoyer une URL de captcha statique encore et encore.
    Les paramètres de requête sont les mots en gras : https://geo.captcha-delivery.com/captcha/?initialCid=yourInitialCid&cid=yourCid&t=fe&referer=https%3A%2F%2Fantoinevastel.com%2Fbots%2Fdatadome&s=YourSParam&e=youreParam ces sont obtenus dans le premier GET où vous obtenez le captcha

  • Le paramètre de requête t, doit avoir la valeur t=fe, si vous avez t=bv, cela signifie que l'URL du captcha est bannie et vous ne pouvez pas nous la soumettre.

  • Correspondre au TLS de la version chrome, en-tête et ordre des en-têtes.

  • Correspondre au proxy utilisé pour résoudre le captcha pour interagir avec la page

Pour obtenir le captcha résolu, vous devez d'abord soumettre toutes les informations nécessaires. Assurez-vous que vous comprenez tous les points pour vous assurer que capsolver peut résoudre correctement le captcha.

Pour résoudre le captcha datadome, suivez notre documentation. Certains paramètres sont requis et d'autres sont facultatifs. Pour cet exemple, nous n'utiliserons que les paramètres requis. Les types de tâches pour datadome sont :

  • DatadomeSliderTask : Ce type de tâche nécessite vos propres proxies.

Pour cet exemple, nous utiliserons DatadomeSliderTask car le site utilise le captcha datadome.
Si des paramètres sont manquants, vous risquez de rencontrer des problèmes avec le token non accepté par le site web.
La première méthode que vous devez utiliser à partir de la documentation est createTask, cette méthode nécessite les paramètres de l'image, certains sont requis et d'autres sont facultatifs, cela dépend du site que nous voulons utiliser.

Étape 1 : Soumettre l'information à capsolver

Utilisez la méthode createTask pour soumettre l'information :

POST https://api.capsolver.com/createTask

    {
    "clientKey": "Votre_API_KEY",
    "task": {
    "type": "DatadomeSliderTask",
    "websiteURL": "https://antoinevastel.com/bots/datadome",
    "captchaUrl": "https://geo.captcha-delivery.com/captcha/?initialCid=yourInitialCid&cid=yourCid&t=fe&referer=https%3A%2F%2Fantoinevastel.com%2Fbots%2Fdatadome&s=YourSParam&e=youreParam",
    "proxy": "yourproxy",
    "userAgent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36"
      }
    }

Étape 2 : Obtention des résultats

Pour vérifier les résultats, vous devez interroger en continu le point de terminaison de l'API getTaskResult jusqu'à ce que le captcha soit résolu.

Voici un exemple de demande :

POST https://api.capsolver.com/getTaskResult
Host: api.capsolver.com
Content-Type: application/json

{
    "clientKey":"VOTRE_API_KEY",
    "taskId": "TASKID_OF_CREATETASK" //ID créé par la méthode createTask
}

Une fois le captcha résolu avec succès, vous recevrez une réponse similaire à celle illustrée dans l'image suivante :

Si le token est rejeté, cela peut indiquer que certaines informations sont manquantes ou incorrectes. Assurez-vous que votre TLS est correct (TLS correspondant à l'agent utilisateur utilisé, bonsheaders, ordre des headers correct et même proxy utilisé pour résoudre le captcha).

Le token du captcha reçu peut être vérifié en soumettant le cookie datadome avec la valeur de la réponse au site pertinent.

En conclusion, bien que la résolution du captcha datadome puisse sembler une tâche ardue, capsolver.com rend le processus rapide et efficace. En suivant les étapes décrites ci-dessus, vous pouvez facilement résoudre datadome.

Capsolver-Team 💜

More

Solving 403 Forbidden Errors When Crawling Websites with Python
Solving 403 Forbidden Errors When Crawling Websites with Python

Learn how to overcome 403 Forbidden errors when crawling websites with Python. This guide covers IP rotation, user-agent spoofing, request throttling, authentication handling, and using headless browsers to bypass access restrictions and continue web scraping successfully.

The other captcha
Logo of Capsolver

Sora Fujimoto

01-Aug-2024

How to Use Selenium Driverless for Efficient Web Scraping
How to Use Selenium Driverless for Efficient Web Scraping

Learn how to use Selenium Driverless for efficient web scraping. This guide provides step-by-step instructions on setting up your environment, writing your first Selenium Driverless script, and handling dynamic content. Streamline your web scraping tasks by avoiding the complexities of traditional WebDriver management, making your data extraction process simpler, faster, and more portable.

The other captcha
Logo of Capsolver

Lucas Mitchell

01-Aug-2024

Scrapy vs. Selenium
Scrapy vs. Selenium: What's Best for Your Web Scraping Project

Discover the strengths and differences between Scrapy and Selenium for web scraping. Learn which tool suits your project best and how to handle challenges like CAPTCHAs.

The other captcha
Logo of Capsolver

Ethan Collins

24-Jul-2024

API vs Scraping
API vs Scraping : the best way to obtain the data

Understand the differences, pros, and cons of Web Scraping and API Scraping to choose the best data collection method. Explore CapSolver for bot challenge solutions.

The other captcha
Logo of Capsolver

Ethan Collins

15-Jul-2024

How to solve CAPTCHA With Selenium C#
How to solve CAPTCHA With Selenium C#

At the end of this tutorial, you'll have a solid understanding of How to solve CAPTCHA With Selenium C#

The other captcha
Logo of Capsolver

Rajinder Singh

10-Jul-2024

What is puppeteer
What is puppeteer and how to use in web scraping | Complete Guide 2024

This complete guide will delve into what Puppeteer is and how to effectively use it in web scraping.

The other captcha
Logo of Capsolver

Lucas Mitchell

09-Jul-2024