Cómo resolver reCAPTCHA con Playwright y CapSolver (Guía paso a paso)
Cómo resolver reCAPTCHA con Playwright y CapSolver (Guía paso a paso)
Aloísio Vítor
Image Processing Expert
04-Sep-2025
¿Es posible que te hayas encontrado con CAPTCHA en tu web scraping? Muchos sitios web emplean un sistema CAPTCHA (el más común es reCAPTCHA) para evitar el acceso automatizado. Pero entonces, en esta guía, te mostraré cómo resolver reCAPTCHA v2 y v3 automáticamente con Playwright usando CapSolver — una potente API para resolver CAPTCHA.
¿Qué es Playwright?
Playwright es una biblioteca de código abierto, Node.js para la automatización del navegador. Es compatible con múltiples navegadores como Chromium, Firefox y WebKit, lo que la convierte en una herramienta versátil para los desarrolladores. Playwright es conocida por su fiabilidad, velocidad y capacidad para gestionar interacciones web complejas, incluyendo el manejo de contenido dinámico, el rellenado de formularios y el manejo de ventanas emergentes.
¿Luchando con el fallo repetido para resolver completamente el irritante captcha?
¡Descubre la resolución automática e impecable de captcha con la tecnología Capsolver AI-powered Auto Web Unblock!
Reclama tu Código de Bono para las mejores soluciones de captcha; CapSolver: WEBS. Después de canjearlo, obtendrás un bono extra del 5% después de cada recarga, Ilimitado
¿Qué es reCAPTCHA y por qué importa en el Web Scraping?
reCAPTCHA es un sistema CAPTCHA diseñado por Google para diferenciar entre usuarios humanos y bots. A menudo presenta a los usuarios tareas como identificar imágenes o simplemente marcar una casilla con la etiqueta "No soy un robot". Si bien estas tareas son sencillas para los humanos, representan un desafío significativo para los bots, que es exactamente el objetivo.
reCAPTCHA viene en varias versiones, cada una diseñada para diferenciar entre humanos y bots de maneras únicas:
reCAPTCHA v1: La versión original requería que los usuarios descifraran y escribieran texto distorsionado en un cuadro de texto.
reCAPTCHA v2: Esta versión introdujo la conocida casilla de verificación donde los usuarios confirman su identidad humana haciendo clic en "No soy un robot". Ocasionalmente, puede pedir a los usuarios que seleccionen imágenes específicas de una cuadrícula para verificar su autenticidad.
reCAPTCHA v3: A diferencia de las versiones anteriores, reCAPTCHA v3 funciona silenciosamente en segundo plano, analizando el comportamiento del usuario para asignar una puntuación de riesgo que indica si es probable que el usuario sea humano o un bot. Esta versión ofrece una experiencia fluida, sin necesidad de interacción directa del usuario.
En este blog, nos centraremos en resolver reCAPTCHA V2 y V3, que se utilizan ampliamente para distinguir a los usuarios genuinos de los bots. reCAPTCHA V2 normalmente muestra una casilla de verificación con el mensaje "No soy un robot", mientras que reCAPTCHA V3 puede aparecer como una insignia invisible, realizando sus comprobaciones sin interrumpir la experiencia del usuario. Aquí hay un ejemplo visual de reCAPTCHA en acción:
¿Por qué usar Playwright para Web Scraping?
La capacidad de Playwright para simular interacciones reales del usuario en múltiples navegadores lo hace ideal para el web scraping. Puede manejar escenarios complejos, como rellenar formularios, navegar por páginas e interactuar con contenido dinámico. Sin embargo, cuando un sitio web emplea reCAPTCHA, Playwright por sí solo no puede resolver el desafío; aquí es donde entra en juego CapSolver.
Paso a paso: Resolver reCAPTCHA v2 con Playwright y CapSolver
CapSolver admite una amplia gama de desafíos CAPTCHA con soporte integral, incluyendo reCAPTCHA v2, v3, y mucho más. Las soluciones personalizadas garantizan una navegación fluida incluso a través de los sistemas de seguridad más avanzados.
Las características clave de CapSolver incluyen:
Amplia gama de CAPTCHA compatibles: Desde reCAPTCHA hasta Turnstile, CapSolver puede manejarlos todos.
Fácil integración de API: Se proporciona documentación detallada documentación, lo que facilita la integración de CapSolver con sus aplicaciones existentes.
Extensiones del navegador: Disponibles para Chrome le permiten resolver CAPTCHA directamente en su navegador.
Precios flexibles: CapSolver ofrece diferentes paquetes de precios para adaptarse a diversas necesidades, asegurando que pueda encontrar un plan que se ajuste a su proyecto.
Instalación y configuración
Para resolver los desafíos de reCAPTCHA utilizando Playwright, deberá instalar la biblioteca playwright-recaptcha. Esta biblioteca requiere que FFmpeg esté instalado en su sistema, lo cual es esencial para transcribir los desafíos de audio de reCAPTCHA v2.
Puede instalar la biblioteca y FFmpeg necesarios utilizando los siguientes comandos según su sistema operativo:
Instalación de la biblioteca:
bashCopy
pip install playwright-recaptcha
Instalación de FFmpeg:
Debian:
bashCopy
apt-get install ffmpeg
MacOS:
bashCopy
brew install ffmpeg
Windows:
bashCopy
winget install ffmpeg
Nota: Asegúrese de que los binarios ffmpeg y ffprobe estén en la ruta de su sistema para que pydub pueda localizarlos.
Integrar CapSolver en su flujo de trabajo
Una vez que tenga las herramientas necesarias instaladas, puede integrar CapSolver en su proyecto de web scraping para manejar los desafíos de reCAPTCHA automáticamente. Aquí hay un ejemplo de cómo hacer esto usando Python:
Código de ejemplo para resolver reCAPTCHA v2 con CapSolver
pythonCopy
# pip install requests
import requests
import time
# TODO: set your config
api_key = "YOUR_API_KEY" # your api key of capsolver
site_key = "6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_mJ-" # site key of your target site
site_url = "https://www.google.com/recaptcha/api2/demo" # page url of your target site
def capsolver():
payload = {
"clientKey": api_key,
"task": {
"type": 'ReCaptchaV2TaskProxyLess',
"websiteKey": site_key,
"websiteURL": site_url
}
}
res = requests.post("https://api.capsolver.com/createTask", json=payload)
resp = res.json()
task_id = resp.get("taskId")
if not task_id:
print("Failed to create task:", res.text)
return
print(f"Got taskId: {task_id} / Getting result...")
while True:
time.sleep(3) # delay
payload = {"clientKey": api_key, "taskId": task_id}
res = requests.post("https://api.capsolver.com/getTaskResult", json=payload)
resp = res.json()
status = resp.get("status")
if status == "ready":
return resp.get("solution", {}).get('gRecaptchaResponse')
if status == "failed" or resp.get("errorId"):
print("Solve failed! response:", res.text)
return
token = capsolver()
print(token)
Código de ejemplo para resolver reCAPTCHA v3 con CapSolver
pythonCopy
# pip install requests
import requests
import time
# TODO: set your config
api_key = "YOUR_API_KEY" # your api key of capsolver
site_key = "6Le-wvkSAAAAAPBMRTvw0Q4Muexq9bi0DJwx_kl-" # site key of your target site
site_url = "https://www.google.com" # page url of your target site
def capsolver():
payload = {
"clientKey": api_key,
"task": {
"type": 'ReCaptchaV3TaskProxyLess',
"websiteKey": site_key,
"websiteURL": site_url,
"pageAction": "login",
}
}
res = requests.post("https://api.capsolver.com/createTask", json=payload)
resp = res.json()
task_id = resp.get("taskId")
if not task_id:
print("Failed to create task:", res.text)
return
print(f"Got taskId: {task_id} / Getting result...")
while True:
time.sleep(1) # delay
payload = {"clientKey": api_key, "taskId": task_id}
res = requests.post("https://api.capsolver.com/getTaskResult", json=payload)
resp = res.json()
status = resp.get("status")
if status == "ready":
return resp.get("solution", {}).get('gRecaptchaResponse')
if status == "failed" or resp.get("errorId"):
print("Solve failed! response:", res.text)
return
token = capsolver()
print(token)
Mejores prácticas para el manejo de CAPTCHA en Web Scraping
Usar proxies: Al raspar sitios web, es importante usar proxies para evitar ser baneado o limitado por velocidad.
Rotar User-Agents: Para evitar aún más la detección, rote sus cadenas de agente de usuario para imitar diferentes navegadores y dispositivos.
Respetar las políticas del sitio web: Siempre verifique el archivo robots.txt del sitio web y cumpla con sus reglas de raspado. Evite sobrecargar los servidores con demasiadas solicitudes.
Manejar los errores correctamente: Implemente el manejo de errores en sus scripts para gestionar los escenarios en los que falla la resolución de CAPTCHA. Esto ayudará a mantener la solidez de sus proyectos de raspado.
Conclusión
Al combinar Playwright con CapSolver, puede omitir reCAPTCHA v2 y v3 automáticamente, manteniendo sus proyectos de raspado funcionando sin problemas. Es rápido, confiable y le ahorra interrupciones manuales.
Preguntas frecuentes sobre la resolución de reCAPTCHA con Playwright
P1: ¿Cuál es la manera más fácil de resolver reCAPTCHA en Playwright?
El método más simple es integrar la API de CapSolver: maneja automáticamente los tokens v2 y v3.
P2: ¿Puede CapSolver manejar reCAPTCHA v3?
Sí. Devuelve un token gRecaptchaResponse basado en su minScore requerido.
P3: ¿Qué tan rápido es CapSolver?
Por lo general, solo unos segundos, dependiendo de la carga del sistema.
P4: ¿Puedo usar CapSolver sin proxies?
Sí, pero los proxies mejoran la estabilidad y reducen los bloqueos.
Aviso de Cumplimiento: La información proporcionada en este blog es solo para fines informativos. CapSolver se compromete a cumplir con todas las leyes y regulaciones aplicables. El uso de la red de CapSolver para actividades ilegales, fraudulentas o abusivas está estrictamente prohibido y será investigado. Nuestras soluciones para la resolución de captcha mejoran la experiencia del usuario mientras garantizan un 100% de cumplimiento al ayudar a resolver las dificultades de captcha durante el rastreo de datos públicos. Fomentamos el uso responsable de nuestros servicios. Para obtener más información, visite nuestros Términos de Servicio y Política de Privacidad.