CAPSOLVER
Blog
Cómo resolver Cloudflare con Playwright en 2024

Cómo solucionar Cloudflare con Playwright en 2024

Logo of CapSolver

Aloísio Vítor

Image Processing Expert

10-Sep-2024

¡Sabes, hay una cierta emoción en burlar los obstáculos, especialmente cuando esos obstáculos son guardianes digitales como Cloudflare. Si alguna vez te has encontrado mirando un desafío de Cloudflare mientras intentas automatizar una tarea web, estás en buena compañía. He estado ahí, muchas veces. Pero en 2024, el juego ha cambiado, y también las herramientas. Déjame guiarte a través de cómo he estado abordando Cloudflare con Playwright, y sí, también hablaremos sobre el nuevo y sigiloso del bloque, Cloudflare Turnstile.

¿Qué es Cloudflare y por qué importa?

Antes de sumergirnos en los detalles de la resolución de los desafíos de Cloudflare, tomemos un momento para comprender a qué nos enfrentamos. Cloudflare es un servicio de seguridad robusto utilizado por millones de sitios web para protegerse contra el tráfico malicioso, los ataques DDoS y una variedad de otras amenazas. Cuando detecta un comportamiento inusual, como un script automatizado que intenta acceder a una página, lanza un desafío, a menudo en forma de CAPTCHA, para verificar que eres un humano y no un bot.

Pero aquí está el truco: Cloudflare ya no se trata solo de lanzar CAPTCHA simples. En 2024, han implementado algo llamado Cloudflare Turnstile, un sistema de desafío más sofisticado y adaptable que está diseñado para ser aún más resistente a la automatización. Es un hueso duro de roer, pero con el enfoque correcto, aún puedes salir victorioso.

¿Te enfrentas a la repetida falla al resolver completamente el irritante captcha?

¡Descubre la resolución automática sin problemas del captcha con la tecnología de desbloqueo web automático impulsada por IA de Capsolver!

Reclama tu Código de bonificación para las mejores soluciones de captcha; CapSolver: WEBS. Después de canjearlo, obtendrás un bono adicional del 5% después de cada recarga, Ilimitado

Por qué Playwright es la herramienta de elección en 2024

Puede que te preguntes: "¿Por qué Playwright? ¿Por qué no seguir con el buen Selenium o Puppeteer?". Y esa es una pregunta válida. La respuesta es que Playwright ha surgido como una potencia para la automatización web, ofreciendo características que lo hacen particularmente efectivo contra los desafíos modernos como los que presenta Cloudflare.

Playwright admite múltiples contextos de navegador, lo que significa que puedes simular diferentes usuarios de manera más efectiva. También proporciona más control sobre el comportamiento del navegador, lo que facilita imitar las interacciones reales del usuario, algo crucial cuando se trata de las medidas de seguridad avanzadas de Cloudflare.

Empezando: Configurando Playwright

Lo primero es lo primero, si aún no lo has hecho, necesitarás instalar Playwright. Configurarlo es sencillo:

bash Copy
npm install playwright

Una vez instalado, estás listo para empezar a automatizar tus tareas web. Pero si tu objetivo es superar los desafíos de Cloudflare, especialmente su nuevo CAPTCHA de Turnstile, tendremos que dar algunos pasos adicionales. Aprovecharemos CapSolver, una API de terceros diseñada para resolver CAPTCHA como Turnstile, e integrarla con Playwright para acceder a los sitios protegidos por Cloudflare.

Paso 1: Capturando el SiteKey

El primer obstáculo que enfrentarás con Turnstile CAPTCHA es obtener el siteKey de la página web. Esta clave es esencial para que CapSolver procese el CAPTCHA y te brinde un token válido.

Puedes extraer el siteKey inspeccionando la fuente de la página web o, para facilitarte la vida, puedes usar la Extensión CapSolver. Detecta automáticamente los parámetros CAPTCHA en la página. Para obtener una guía detallada sobre cómo configurar esto, consulta nuestra publicación de blog:
Identifica los parámetros de Cloudflare Turnstile.

Una vez que tengas el siteKey, estás listo para pasar al siguiente paso.

Paso 2: Llamando a la API de CapSolver para resolver el CAPTCHA

Con el siteKey en la mano, es hora de usar la API de CapSolver para resolver el CAPTCHA de Turnstile y recuperar un token válido. Este token nos permitirá eludir el desafío y continuar con nuestras tareas de raspado web o automatización.

Aquí tienes un fragmento de código de muestra que utiliza axios y Playwright para interactuar con CapSolver:

javascript Copy
const axios = require('axios');
const playwright = require("playwright");

const api_key = "YOUR_API_KEY"; // Tu clave API de CapSolver
const site_key = "0xxxxxx"; // El siteKey que recuperaste
const site_url = "https://xxx.xxx.xxx/xxx"; // La URL del sitio web de destino
const proxy = "http://xxx:[email protected]:x"; // Opcional: Utiliza tu proxy si es necesario

async function solveCaptcha() {
  const payload = {
    clientKey: api_key,
    task: {
      type: 'AntiTurnstileTaskProxyLess',
      websiteKey: site_key,
      websiteURL: site_url,
      metadata: {
        action: '', // Opcional, especifica si es necesario
        type: "turnstile"
      }
    }
  };

  try {
    const res = await axios.post("https://api.capsolver.com/createTask", payload);
    const task_id = res.data.taskId;
    if (!task_id) {
      console.log("Fallo al crear la tarea:", res.data);
      return;
    }

    console.log("Tarea creada, esperando el token...");

    while (true) {
      await new Promise(resolve => setTimeout(resolve, 1000)); // Espera 1 segundo antes de volver a comprobar
      const getResultPayload = {clientKey: api_key, taskId: task_id};
      const resp = await axios.post("https://api.capsolver.com/getTaskResult", getResultPayload);
      
      if (resp.data.status === "ready") {
        console.log("CAPTCHA resuelto, token recibido:", resp.data.solution.token);
        return resp.data.solution.token;
      }

      if (resp.data.status === "failed" || resp.data.errorId) {
        console.log("¡Resolución de CAPTCHA fallida! Respuesta:", resp.data);
        return;
      }
    }
  } catch (error) {
    console.error("Error al resolver CAPTCHA:", error);
  }
}

En este código, creamos una tarea enviando una solicitud POST a la API de CapSolver, pasando el siteKey y la URL del sitio web al que queremos acceder. Una vez que se crea la tarea, comprobamos continuamente el estado hasta que CapSolver devuelve un token de solución. Este token es el que usaremos para demostrar a Cloudflare que somos humanos.

Paso 3: Inyectando el token CAPTCHA con Playwright

Ahora que tenemos el token CAPTCHA, necesitamos inyectarlo en la sesión como una cookie usando Playwright. Esto nos permitirá navegar por el sitio sin ser bloqueados por la protección de Cloudflare. Aquí tienes cómo hacerlo:

javascript Copy
const wait = (ms) => new Promise(resolve => setTimeout(resolve, ms));

async function accessSiteWithToken(){
  let clearanceCookie;

  // Resuelve CAPTCHA y obtén el token
  await solveCaptcha().then(token => {
    clearanceCookie = token;
  });

  const browser = await playwright.chromium.launch();
  const context = await browser.newContext();
  const page = await context.newPage();

  await wait(500);

  // Inyecta el token como una cookie
  await page.setCookie({
    name: "cf_clearance",
    value: clearanceCookie,
    url: site_url, // Asegúrate de que esto coincida con la URL de destino
    domain: "xx.xx.xx" // Ajusta el dominio según el sitio real
  });

  await wait(500);

  // Navega al sitio web después de configurar la cookie
  await page.goto(site_url);
  
  // Ahora puedes raspar el contenido o interactuar con la página libremente
  console.log("¡Acceso al sitio web correcto!");

  await browser.close();
}

// Ejecuta el script para acceder al sitio
accessSiteWithToken().then();

Reflexiones finales

Cloudflare sin duda ha hecho que sea más difícil raspar sitios web o automatizar tareas en 2024, pero con herramientas como Playwright y CapSolver, el desafío está lejos de ser imposible. La capacidad de Playwright para simular interacciones reales del usuario combinada con la API de resolución de CAPTCHA de CapSolver proporciona una forma poderosa de eludir estas barreras sin sudar.

Por supuesto, siempre es una buena idea asegurarse de que te mantienes dentro de los límites de las prácticas éticas y legales de raspado. Algunos sitios web tienen políticas estrictas con respecto al acceso automatizado, así que asegúrate de conocerlas antes de proceder.

En el mundo en constante evolución de la automatización web, todo se trata de estar a la vanguardia, y con Playwright y CapSolver, estás equipado para hacer precisamente eso.

Aviso de Cumplimiento: La información proporcionada en este blog es solo para fines informativos. CapSolver se compromete a cumplir con todas las leyes y regulaciones aplicables. El uso de la red de CapSolver para actividades ilegales, fraudulentas o abusivas está estrictamente prohibido y será investigado. Nuestras soluciones para la resolución de captcha mejoran la experiencia del usuario mientras garantizan un 100% de cumplimiento al ayudar a resolver las dificultades de captcha durante el rastreo de datos públicos. Fomentamos el uso responsable de nuestros servicios. Para obtener más información, visite nuestros Términos de Servicio y Política de Privacidad.

Máse

CAPTCHA AI Impulsado por Grandes Modelos
CAPTCHA IA impulsada por grandes modelos: ¿Por qué es más adecuada para escenarios empresariales?

Cómo los modelos visuales de IA están transformando el reconocimiento de CAPTCHA y por qué las soluciones empresariales necesitan datos, escala y entrenamiento personalizado.

AI
Logo of CapSolver

Aloísio Vítor

13-Mar-2026

WebMCP vs MCP: ¿Cuál es la diferencia para los agentes de IA?
WebMCP vs MCP: ¿Cuál es la diferencia para los agentes de inteligencia artificial?

Explora las diferencias clave entre WebMCP y MCP para agentes de IA, entendiendo sus roles en la automatización web y la interacción con datos estructurados. Aprende cómo estos protocolos moldean el futuro de las capacidades de los agentes de IA.

AI
Logo of CapSolver

Nikolai Smirnov

13-Mar-2026

OpenClaw vs. Nanobot
OpenClaw vs. Nanobot: Elegir tu Agente de IA para la automatización

Compara OpenClaw y Nanobot, dos marcos de agentes de inteligencia artificial líderes, para una automatización eficiente. Descubre sus características, rendimiento y cómo CapSolver mejora sus capacidades.

AI
Logo of CapSolver

Emma Foster

11-Mar-2026

Resolver Cloudflare Turnstile Usando CapSolver y n8n
Cómo resolver Cloudflare Turnstile usando CapSolver y n8n

Crea una API de resolución de Cloudflare Turnstile usando CapSolver y n8n. Aprende a automatizar la resolución de tokens, enviarlo a sitios web y extraer datos protegidos sin programación.

web scraping
Logo of CapSolver

Adélia Cruz

10-Mar-2026

Resolver CAPTCHA en OpenClaw
Cómo resolver CAPTCHA en OpenClaw – Guía paso a paso con la extensión CapSolver

Aprende a resolver CAPTCHA en OpenClaw usando la extensión Chrome CapSolver para una automatización de navegador de IA sin problemas.

AI
Logo of CapSolver

Adélia Cruz

06-Mar-2026

Estrategia de Multi-Cuentas
¿Por qué su estrategia de multi-cuentas necesita tanto la aislación del entorno como el bypass de la IA?

Domina la gestión de múltiples cuentas con AdsPower y CapSolver. Utiliza el aislamiento de entornos y el bypass de IA para evitar que se banee las cuentas.

AI
Logo of CapSolver

Adélia Cruz

02-Mar-2026