CAPSOLVER
Blog
Como Resolver o Cloudflare com Playwright em 2024

Como Resolver o Cloudflare com Playwright em 2024

Logo of CapSolver

Adélia Cruz

Neural Network Developer

10-Sep-2024

Sabe, existe uma certa emoção em superar obstáculos, especialmente quando esses obstáculos são guardiões digitais como o Cloudflare. Se você já se viu olhando para um desafio do Cloudflare enquanto tentava automatizar uma tarefa na web, você está em boa companhia. Já estive lá, muitas vezes. Mas em 2024, o jogo mudou e as ferramentas também. Deixe-me guiá-lo por como tenho lidado com o Cloudflare com o Playwright, e sim, também falaremos sobre o novo e furtivo na área, o Cloudflare Turnstile.

O que é o Cloudflare e por que ele importa

Antes de mergulharmos no cerne da resolução de desafios do Cloudflare, vamos dedicar um momento para entender o que estamos enfrentando. O Cloudflare é um serviço de segurança robusto usado por milhões de sites para se proteger de tráfego malicioso, ataques DDoS e uma variedade de outras ameaças. Quando ele detecta um comportamento incomum - como um script automatizado tentando acessar uma página - ele lança um desafio, geralmente na forma de um CAPTCHA, para verificar se você é um humano e não um bot.

Mas aqui está o ponto principal: o Cloudflare não se limita a lançar CAPTCHAs simples. Em 2024, eles lançaram algo chamado Cloudflare Turnstile, um sistema de desafio mais sofisticado e adaptativo que é projetado para ser ainda mais resistente à automação. É uma tarefa difícil, mas com a abordagem certa, você ainda pode sair por cima.

Está lutando com a falha repetida em resolver completamente o irritante captcha?

Descubra a resolução automática perfeita de captchas com a tecnologia Capsolver Auto Web Unblock, alimentada por IA!

Reivindique seu Código de Bônus para as melhores soluções de captcha; CapSolver: WEBS. Após resgatá-lo, você receberá um bônus extra de 5% após cada recarga, Ilimitado

Por que o Playwright é a ferramenta de escolha em 2024

Você pode estar se perguntando: "Por que o Playwright? Por que não ficar com o bom e velho Selenium ou Puppeteer?" E essa é uma pergunta justa. A resposta é que o Playwright emergiu como uma potência para automação da web, oferecendo recursos que o tornam particularmente eficaz contra desafios modernos como os apresentados pelo Cloudflare.

O Playwright oferece suporte a vários contextos de navegador, o que significa que você pode simular diferentes usuários de forma mais eficaz. Ele também fornece mais controle sobre o comportamento do navegador, facilitando a imitação de interações reais do usuário - algo crucial ao lidar com as medidas de segurança avançadas do Cloudflare.

Começando: configurando o Playwright

Primeiro, se você ainda não o fez, precisará instalar o Playwright. Configurá-lo é direto:

bash Copy
npm install playwright

Depois de instalado, você está pronto para começar a automatizar suas tarefas na web. Mas se seu objetivo é superar os desafios do Cloudflare, especialmente seu novo CAPTCHA Turnstile, precisaremos dar alguns passos extras. Usaremos CapSolver, uma API de terceiros projetada para resolver CAPTCHAs como o Turnstile, e integrá-la ao Playwright para acessar sites protegidos pelo Cloudflare.

Passo 1: pegando o SiteKey

O primeiro obstáculo que você enfrentará com o CAPTCHA Turnstile é obter o siteKey da página da web. Essa chave é essencial para o CapSolver processar o CAPTCHA e fornecer um token válido.

Você pode extrair o siteKey inspecionando a fonte da página da web ou, para facilitar a vida, pode usar a Extensão CapSolver. Ela detecta automaticamente os parâmetros do CAPTCHA na página. Para um guia detalhado sobre como configurar isso, consulte nosso post de blog:
Identifique os parâmetros do Cloudflare Turnstile.

Assim que você tiver o siteKey, estará pronto para avançar para a próxima etapa.

Passo 2: Chamando a API CapSolver para resolver o CAPTCHA

Com o siteKey em mãos, é hora de usar a API do CapSolver para resolver o CAPTCHA Turnstile e recuperar um token válido. Esse token nos permitirá contornar o desafio e prosseguir com nossas tarefas de scraping ou automação na web.

Aqui está um trecho de código de amostra usando axios e Playwright para interagir com o CapSolver:

javascript Copy
const axios = require('axios');
const playwright = require("playwright");

const api_key = "YOUR_API_KEY"; // Sua chave de API CapSolver
const site_key = "0xxxxxx"; // O siteKey que você recuperou
const site_url = "https://xxx.xxx.xxx/xxx"; // O URL do site de destino
const proxy = "http://xxx:[email protected]:x"; // Opcional: Use seu proxy se necessário

async function solveCaptcha() {
  const payload = {
    clientKey: api_key,
    task: {
      type: 'AntiTurnstileTaskProxyLess',
      websiteKey: site_key,
      websiteURL: site_url,
      metadata: {
        action: '', // Opcional, especifique se necessário
        type: "turnstile"
      }
    }
  };

  try {
    const res = await axios.post("https://api.capsolver.com/createTask", payload);
    const task_id = res.data.taskId;
    if (!task_id) {
      console.log("Falha ao criar tarefa:", res.data);
      return;
    }

    console.log("Tarefa criada, aguardando token...");

    while (true) {
      await new Promise(resolve => setTimeout(resolve, 1000)); // Aguardar 1 segundo antes de verificar novamente
      const getResultPayload = {clientKey: api_key, taskId: task_id};
      const resp = await axios.post("https://api.capsolver.com/getTaskResult", getResultPayload);
      
      if (resp.data.status === "ready") {
        console.log("CAPTCHA resolvido, token recebido:", resp.data.solution.token);
        return resp.data.solution.token;
      }

      if (resp.data.status === "failed" || resp.data.errorId) {
        console.log("Falha ao resolver o CAPTCHA! Resposta:", resp.data);
        return;
      }
    }
  } catch (error) {
    console.error("Erro ao resolver o CAPTCHA:", error);
  }
}

Neste código, criamos uma tarefa enviando uma solicitação POST para a API do CapSolver, passando o siteKey e o URL do site que queremos acessar. Depois que a tarefa é criada, verificamos continuamente o status até que o CapSolver retorne um token de solução. Esse token é o que usaremos para provar ao Cloudflare que somos humanos.

Passo 3: Injetando o token CAPTCHA com o Playwright

Agora que temos o token CAPTCHA, precisamos injetá-lo na sessão como um cookie usando o Playwright. Isso nos permitirá navegar pelo site sem ser bloqueados pela proteção do Cloudflare. Aqui está como fazer isso:

javascript Copy
const wait = (ms) => new Promise(resolve => setTimeout(resolve, ms));

async function accessSiteWithToken(){
  let clearanceCookie;

  // Resolver o CAPTCHA e obter o token
  await solveCaptcha().then(token => {
    clearanceCookie = token;
  });

  const browser = await playwright.chromium.launch();
  const context = await browser.newContext();
  const page = await context.newPage();

  await wait(500);

  // Injetar o token como um cookie
  await page.setCookie({
    name: "cf_clearance",
    value: clearanceCookie,
    url: site_url, // Certifique-se de que isso corresponda ao URL de destino
    domain: "xx.xx.xx" // Ajuste o domínio de acordo com o site real
  });

  await wait(500);

  // Navegar para o site após definir o cookie
  await page.goto(site_url);
  
  // Agora você pode fazer scraping do conteúdo ou interagir com a página livremente
  console.log("Acesso ao site realizado com sucesso!");

  await browser.close();
}

// Executar o script para acessar o site
accessSiteWithToken().then();

Considerações finais

O Cloudflare, sem dúvida, tornou mais difícil fazer scraping de sites ou automatizar tarefas em 2024, mas com ferramentas como Playwright e CapSolver, o desafio está longe de ser impossível. A capacidade do Playwright de simular interações reais do usuário combinada com a API de resolução de CAPTCHA do CapSolver fornece uma maneira poderosa de contornar essas barreiras sem suar muito.

Claro, sempre é uma boa ideia garantir que você esteja dentro dos limites das práticas de scraping legais e éticas. Alguns sites têm políticas rigorosas em relação ao acesso automatizado, por isso certifique-se de que você esteja ciente delas antes de prosseguir.

No mundo em constante evolução da automação da web, tudo se resume a estar à frente da curva - e com o Playwright e o CapSolver, você está equipado para fazer exatamente isso.

Declaração de Conformidade: As informações fornecidas neste blog são apenas para fins informativos. A CapSolver está comprometida em cumprir todas as leis e regulamentos aplicáveis. O uso da rede CapSolver para atividades ilegais, fraudulentas ou abusivas é estritamente proibido e será investigado. Nossas soluções de resolução de captcha melhoram a experiência do usuário enquanto garantem 100% de conformidade ao ajudar a resolver dificuldades de captcha durante a coleta de dados públicos. Incentivamos o uso responsável de nossos serviços. Para mais informações, visite nossos Termos de Serviço e Política de Privacidade.

Mais

Alterar o Agente de Usuário no Selenium
Alterar o User-Agent no Selenium | Passos & Boas Práticas

Alterar o Agente de Usuário no Selenium é um passo crucial para muitas tarefas de raspagem da web. Ajuda a disfarçar o script de automação como um navegador regular...

The other captcha
Logo of CapSolver

Emma Foster

05-Dec-2025

Como identificar se `action` é necessário para resolver o Cloudflare Turnstile usando a extensão CapSolver
Como identificar se `action` é necessário para resolver o Cloudflare Turnstile usando a extensão CapSolver

Aprenda a identificar ações para resolução eficaz de captchas cloudflare turnstile. Siga nosso guia passo a passo sobre o uso das ferramentas e técnicas do Capsolver.

Cloudflare
Logo of CapSolver

Aloísio Vítor

05-Dec-2025

9proxy
Descubra o Poder do 9Proxy: Uma Revisão Abrangente

Neste artigo, vamos mostrar a você o que é 9proxy e os serviços que eles oferecem.

Partners
Logo of CapSolver

Ethan Collins

04-Dec-2025

Raspagem de Web com Selenium e Python
Web Scraping com Selenium e Python | Resolvendo Captcha Ao Fazer Web Scraping

Neste artigo, você vai se familiarizar com a raspagem de dados da web usando o Selenium e o Python, e aprender a resolver o Captcha envolvido no processo para uma extração de dados eficiente.

web scraping
Logo of CapSolver

Anh Tuan

04-Dec-2025

Painel de Controle CapSolver 3.0!
Suba de nível com o CapSolver Dashboard 3.0!

O Dashboard CapSolver 3.0 foi recentemente atualizado com interação aprimorada e uma série de novas funcionalidades.

The other captcha
Logo of CapSolver

Emma Foster

04-Dec-2025

Melhor extensão de resolução automática de CAPTCHA no Mozilla Firefox
Melhor extensão para resolver CAPTCHA automático no Mozilla Firefox

Ao usar algumas extensões criadas para o Mozilla Firefox, podemos automatizar facilmente este processo, economizando tempo e esforço valiosos.

Extension
Logo of CapSolver

Rajinder Singh

04-Dec-2025