CAPSOLVER
Blog
Como contornar o desafio do Cloudflare durante a raspagem da web em 2025

Como contornar o desafio do Cloudflare durante a raspagem da web em 2025

Logo of CapSolver

Adélia Cruz

Neural Network Developer

23-Jan-2025

Introdução: Por que o Cloudflare é o Nemesis dos Scrapers

Vamos ser realistas: se você tentou raspar a web nos últimos anos, provavelmente desistiu com raiva depois de ver a infame tela "Verificando seu navegador" do Cloudflare. Em 2025, o Cloudflare dobrou a aposta na proteção de sites contra bots, fazendo com que a raspagem parecesse um jogo de whack-a-mole.

Mas por que se dar ao trabalho de contorná-lo? Simples: dados são poder. Se você está rastreando preços, agregando conteúdo ou analisando tendências, os muros do Cloudflare não conseguem parar todos. Veja como navegar no labirinto sem ficar preso no purgatório do CAPTCHA.

Desafio do Cloudflare vs. Turnstile: Qual a diferença?

Desafio do Cloudflare

Este é o clássico ponto de verificação "Eu não sou um robô". Ele verifica as impressões digitais do seu navegador (como cookies, suporte a JavaScript e reputação de IP) e exibe CAPTCHAs se algo parecer estranho. Pense nisso como um segurança verificando sua identidade.

Cloudflare Turnstile

Apresentado como uma "alternativa que preserva a privacidade", o Turnstile é o widget CAPTCHA mais novo e sofisticado do Cloudflare. Ele funciona em segundo plano para verificar humanos sem quebra-cabeças irritantes — na maioria das vezes. Mas se ele suspeitar de atividade de bot, ainda assim o atingirá com um desafio.

Por que as pessoas os confundem?

  • Ambos bloqueiam bots.
  • Ambos usam CAPTCHAs como último recurso.

Como contornar os desafios do Cloudflare em 2025

Método 1: Resolução manual de CAPTCHA

  • Como funciona: Você resolve os CAPTCHAs sozinho. Sim, como um camponês medieval.
  • Prós: Grátis (se seu tempo não tem valor).
  • Contras: Não é escalável. Você vai enlouquecer depois de 10 CAPTCHAs. Isso pode ser você depois de resolver 10 captchas manualmente: vídeo

Ferramentas como Puppeteer, Playwright, FlareSolver imitam navegadores reais. Adicione plug-ins ocultos para esconder impressões digitais de automação.

  • Dica: Gire os agentes de usuário e use proxies residenciais para evitar bloqueios de IP. Use o mesmo IP de proxy, userAgent, TLS, cabeçalhos da versão do Chrome que você está usando para usar o cookie cf_clearance

Método 3: Serviços de resolução de CAPTCHA

É aqui que o Capsolver brilha. Ele automatiza a resolução de desafios do Cloudflare e Turnstile.


Como resolver o Desafio do Cloudflare

  • Proxy é necessário, por favor, use proxy estático ou proxy Sticky em vez de proxy rotativo.
  • O userAgent personalizado não é atualmente suportado, por favor, use os cabeçalhos e cookies retornados pela nossa API.
  • Se você falhar em obter a solução, seu IP pode ser bloqueado, por favor, tente mudar seu proxy.
  • Você deve usar a biblioteca de solicitação TLS para solicitar o site de destino.
json Copy
POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "AntiCloudflareTask",
    "websiteURL": "https://www.yourwebsite.com",
    "proxy": "ip:port:user:pass"
  }
}

Requisitos críticos para o sucesso da solução

Para garantir que a solução retornada funcione conforme o esperado, a consistência é fundamental. Você deve aderir ao seguinte:

  1. Endereço IP
    Use o mesmo endereço IP usado durante o processo de resolução de desafio. Alterar IPs (por exemplo, proxies, redes) invalidará a solução.

  2. User-Agent e Cabeçalhos

    • Preserve a string User-Agent exata da solicitação original.
    • Inclua todos os cabeçalhos retornados pelo Capsolver em solicitações subsequentes.
  3. Impressão digital TLS
    O Cloudflare valida impressões digitais TLS. Para evitar discrepâncias:


Como resolver o Cloudflare Turnstile

  • O tipo Turnstile não requer proxy, então você apenas usa AntiTurnstileTaskProxyLess
json Copy
POST https://api.capsolver.com/createTask
Host: api.capsolver.com
Content-Type: application/json
{
  "clientKey": "YOUR_API_KEY",
  "task": {
    "type": "AntiTurnstileTaskProxyLess",
    "websiteURL": "https://www.yourwebsite.com",
    "websiteKey": "0x4XXXXXXXXXXXXXXXXX",
    "metadata": {
       "action": "login",  //opcional
       "cdata": "0000-1111-2222-3333-example-cdata"  //opcional
    }
  }
}

A colocação do token depende da implementação do site de destino. Inspecione o tráfego de rede durante interações manuais para identificar o parâmetro ou cabeçalho exato que requer o token.

4. Erros comuns (e como corrigi-los)

Erro 1: Usar a ferramenta errada para Turnstile vs. Desafio

Aqui está uma reformulação polida e profissional do seu conteúdo:

  • Diferenciando o Desafio do Cloudflare e o Turnstile
    Um ponto problemático comum para desenvolvedores é distinguir entre os sistemas Desafio e Turnstile do Cloudflare, especialmente ao integrar soluções como o Capsolver. Veja como diagnosticar e resolver a confusão entre os dois:

  • Por que o AntiTurnstileTaskProxyLess falha com o erro 600010
    Se você estiver usando o tipo de tarefa AntiTurnstileTaskProxyLess do Capsolver e encontrar o erro:
    callback: error-callback, error: 600010
    Isso indica uma incompatibilidade: você está tentando resolver um Desafio do Cloudflare (que requer um tipo de tarefa diferente) em vez de um CAPTCHA Turnstile.

  • Como identificar qual sistema um site usa

    1. Verifique o cookie cf_clearance
      • Desafio do Cloudflare: Gera um cookie cf_clearance após a verificação bem-sucedida.
      • Turnstile: Nenhum cookie cf_clearance é criado.

Resolvendo o erro

  1. Verifique o produto Cloudflare

    • Use as etapas acima para confirmar se o site usa Desafio ou Turnstile.
  2. Escolha o tipo de tarefa Capsolver correto

    • Para o Desafio do Cloudflare: Use tipos de tarefa projetados para contornar o Desafio (por exemplo, AntiCloudflareTask).
    • Para Turnstile: Mantenha o AntiTurnstileTaskProxyLess.
  3. Revise a documentação do Capsolver

    • Faça referência cruzada a exemplos de implementação em seus guias:

Erro 2: Ignorar a rotação de IP/Cabeçalhos/UserAgent

O Cloudflare lista na lista negra IPs/Cabeçalhos/UserAgents suspeitos. Gire seus proxies, agente de usuário, configurações tls, cabeçalhos...

Mesmo com navegadores sem cabeça, detalhes ausentes como renderização WebGL ou fusos horários podem acionar o Cloudflare. Use ferramentas como Puppeteer-Stealth.

Conclusão

Dica final: Se você estiver preso, pergunte a si mesmo: "Esses dados valem o trabalho?" Às vezes, pagar por uma API (se disponível) economiza tempo, sanidade...

Boa sorte, e que os deuses CAPTCHA sorriam para você! 🛡️🤖

Declaração de Conformidade: As informações fornecidas neste blog são apenas para fins informativos. A CapSolver está comprometida em cumprir todas as leis e regulamentos aplicáveis. O uso da rede CapSolver para atividades ilegais, fraudulentas ou abusivas é estritamente proibido e será investigado. Nossas soluções de resolução de captcha melhoram a experiência do usuário enquanto garantem 100% de conformidade ao ajudar a resolver dificuldades de captcha durante a coleta de dados públicos. Incentivamos o uso responsável de nossos serviços. Para mais informações, visite nossos Termos de Serviço e Política de Privacidade.

Mais

Melhores agentes de usuário para web scraping & como usá-los
Melhores agentes de usuário para web scraping e como usá-los

Um guia para os melhores agentes de usuário para web scraping e seu uso eficaz para evitar detecção. Explore a importância dos agentes de usuário, seus tipos e como implementá-los para web scraping sem problemas e indetectável.

Logo of CapSolver

Adélia Cruz

07-Mar-2025

Como Resolver o Desafio Cloudflare JS para Web Scraping e Automação
Como Resolver o Desafio Cloudflare JS para Web Scraping e Automação

Aprenda a resolver o desafio JavaScript do Cloudflare para web scraping e automação sem problemas. Descubra estratégias eficazes, incluindo o uso de navegadores headless, rotação de proxies e aproveitando as capacidades avançadas de resolução de CAPTCHA do CapSolver.

Cloudflare
Logo of CapSolver

Aloísio Vítor

05-Mar-2025

Impressão digital TLS do Cloudflare: O que é e como resolvê-la
Impressão digital TLS do Cloudflare: O que é e como resolvê-la

Saiba como o Cloudflare usa impressão digital TLS para segurança, como detecta e bloqueia bots e explore métodos eficazes para resolvê-la para tarefas de web scraping e navegação automatizada.

Logo of CapSolver

Aloísio Vítor

28-Feb-2025

Por que continuo sendo solicitado a verificar que não sou um robô?
Por que continuo sendo solicitado a verificar que não sou um robô?

Saiba por que o Google solicita que você verifique se não é um robô e explore soluções como o uso da API do CapSolver para resolver desafios de CAPTCHA de forma eficiente.

Logo of CapSolver

Ethan Collins

27-Feb-2025

Por que os sites acham que sou um robô? E como resolver isso
Por que os sites acham que sou um robô? E como resolver isso?

Entenda por que sites o marcam como bot e como evitar a detecção. Os principais gatilhos incluem desafios CAPTCHA, IPs suspeitos e comportamento incomum do navegador.

Logo of CapSolver

Adélia Cruz

20-Feb-2025

Como extrair dados de um site protegido pelo Cloudflare
Como extrair dados de um site protegido pelo Cloudflare

Neste guia, exploraremos técnicas éticas e eficazes para extrair dados de sites protegidos pelo Cloudflare.

Cloudflare
Logo of CapSolver

Adélia Cruz

20-Feb-2025