Glosario de Extracción de Datos
Un glosario completo de términos relacionados con web scraping, automatización, resolución de CAPTCHA, extracción de datos, proxies y automatización de navegadores.
#
1 término
A
58 términos
ActorActor CorreActos de interés propioAdhesividadAdministrador de DatosAdvertenciaAgente de usuarioAgente de Usuario No CoincidenteAhorros PotencialesAIOAlfabetización de datosAlgoritmo PageRankAlgoritmos de predicción de enlacesAlgoritmos de Retroceso de TasaAlmacén de datosAlmacenamiento de Claves y ValoresAlmacenamiento de documentosAlmacenes de datosAlucinación de LLMAmenazas de CiberseguridadAnálisisAnálisis CuantitativoAnálisis de datosAnálisis de Datos ForensesAnálisis de Datos LagrangianoAnálisis de HTMLAnálisis de JSONAnálisis de sentimientoAnálisis de Tráfico de DatosAnálisis DescriptivoAnálisis DiagnósticoAnálisis heurísticoAnálisis MultidimensionalAnalizador de HTML/XMLAPI asíncronaAPI de Observador de IntersecciónAPI RESTApilamiento de anunciosAprendizaje AutomáticoAprendizaje FederadoAprendizaje IncrementalarañaArañaArbitraje de búsquedaArbitraje de PublicidadArbitraje de TráficoArquitectura de la InformaciónarregloArregloAseguramiento de la Calidad de los DatosAsnAtaque de negación de servicio distribuidoAtaque de scraping webAtaques de XSS ReflejadoAtributo HTMLAutenticación de dos factores (2FA)Automatización de Procesos con RobotsAxios
B
28 términos
BanderinesBase de datos vectorialBases de datos de grafosBenchmarkingBiblioteca de APIBloqueador de anunciosBloqueo de IPBloqueo de raspadoresBotBot ArtificialBot de clicsBot de intercambio de archivosBot de JuegoBot de MonitoreoBot de publicidadBot de Red SocialBot de Redes SocialesBot de spamBot de TradingBot de TransferenciaBrecha de datosBucle ParaBueno resultadoBuscador de Alimentos BotBúsqueda & Protección Social™Búsqueda en AnchuraBúsqueda en ProfundidadBúsqueda Orgánica
C
58 términos
C más másC#Cabecera HTTPCachéCadena de Valor de DatosCalidad de los datosCallbackCampañaCaptchaCardingCarga útilCDPCentro de datosCentro de datos ProxyCentro de Datos ProxysCertificación PCI DSSChatbotCheerioCI/CD para ScrapersCiberseguridad en saludCifrado a Nivel de CampoCifrado HomomórficoClasificación de palabras claveClave de APIClic ocultoClic SpammingCloudflare Portal de entradaCodificación de URLCódigo de estadoCódigo UTM (Módulo de Seguimiento de Urchin)Cola de solicitudesCollyComercio electrónicoComprensión del Lenguaje NaturalComputación en el bordeComputación en memoriaCómputo de Alto RendimientoComunicaciones en tiempo real de la WebConcurrenciasConjunto de datosConjuntos de ReglasConsultaContador BotConversión de formato de archivoCorreo no deseadoCosto de Adquisición de Tráfico (TAC)Cpa (Costo por Acción)CPC (Costo por Clic)Cpl (Costo por Líder)Cpm (Costo por mil)Crawl RuncrawlearCrawleeCréditos de APICriminalística DigitalCumbre de Extracción de Datos de la WebCumplimiento de Soc 2Curación de Datos
D
34 términos
Árbol DOMDaasDataFrameDatos AlternativosDatos de la máquinaDatos de la Parte CeroDatos de Referencia InconsistentesDatos del productoDatos EstructuradosDatos externosDatos no estructuradosDatos OcultosDatos RuidososDatos VinculadosDeduplicación de DatosDemanda Investigativa Civil (CID)Denegación de ServicioDerechos de autor BotDescubrimiento de ConocimientoDescubrimiento de datosDetección AutomáticaDetección de botsDetección de Infracción de Derecho de AutorDetección de Paginación AutomáticaDetección y Prevención de Intrusión - CapSolver GlosarioDetección y Respuesta Extendida (XDR)Detener BotsDetener los ataques DDOSDirección IPDiseño AdaptativoDiseño de Base de DatosDisponibilidadDomDominio
E
28 términos
E-E-A-TEliminar BotsÉlite ProxiesEncadenamientoEnmascaramiento de IP o suplantación de IPEnrutamiento de Proxy InteligenteEntorno de usuarioEntorno VirtualEntrega de AlimentaciónEntrenamientoEscaladoEspía BotEsquemaEstafas de clientes potenciales mediante llamada de retornoEstándares de DatosEstante DigitalEstructuración de DatosEtiqueta HTMLETL Extraer Transformar CargarEvaluación de Vulnerabilidadesexpresión regularExtracción automatizadaExtracción de característicasExtracción de datosExtracción de NubeExtractorExtractor BotExtraer Cargar Transformar
F
22 términos
Falso PositivoFalsos LeadsFase de estaging de datosFatiga de alertaFederación de DatosFiltros de cumplimientoFirewall de Aplicaciones Web WAFFirewall de VisitantesFlujos de KafkaFormato de Datos JerárquicosFormulario BotFragmentaciónFragmento destacadoFraude de anunciosFraude de botsFraude de clicFraude de CtvFraude de EnumeraciónFraude de marketing de afiliaciónFraude de VisualizaciónFraude en el comercio electrónicoFusión de Datos
G
19 términos
galletaGenealogía de los DatosGeneración de ProspectosGenerativo Preentrenado TransformadorGestión de botsGestión de Datos EmpresarialesGestión de Datos MaestrosGestión de metadatosGit BashGIVTGoGobernanzaGobernanza de DatosGobernanza de la nubeGran DatosGrandes ExpectativasGraph de ConocimientoGrupo de Responsabilidad Confiable (TAG)Guerra Cibernética
I
30 términos
IA Raspado de WebIdempotencia - Glosario de CapSolverIdentificaciónIdentificación por huella de AudiocontextoIdentificador de Recurso UniformeImpersonador BotImpresión BotIndexaciónIndexación de bases de datosIndicadores Clave de DesempeñoInforme de DatosIngeniería inversaIngestiónInicio de sesión único (SSO)InstanciaIntegración de datosIntegración de datos legadosIntegridad de IPIntegridad de los datosInteligencia CompetitivaInteligencia de MercadoInteligencia de PrecioIntercambio de ID de AfiliadoInterfaz de Programación de AplicacionesInternet de las CosasInundación de ClicsInyección de anunciosInyección de clicInyección de cookiesIPv4
J
5 términos
M
32 términos
MacrosMagecartMarketing de AfiliadosMarketing DigitalMarketing por correo electrónicoMecanismos Anti-ScrapingMetadatosMétodo HTTPMétricas de vanidadMezcla de DatosMigración de datosMigración de nubemimoMinado de datosMinuciosidadModelado de DatosModelado DimensionalModelo de Capa de la AplicaciónModelo de Datos Lógicomodelo de lenguaje grandeModelo OSIModelos de datos híbridosMonitoreoMonitoreo de PrometheusMonitoreo de RedesMonitoreo de usuario con privilegiosMontón de henoMotor de búsqueda BotMotores de RenderizadoMóvilMuestreoMySQL
N
17 términos
P
66 términos
Índice de PrecioPágina de Listadospágina de resultados de búsquedaPágina DinámicaPágina estáticaPaginaciónPago por ClicParámetros de APIParticionadoPatrones de clic consistentesPerfilado de DatosPerfilado del Comportamiento del NavegadorPerspectivasPescado de clicPhishingPlantilla de TareaPlataforma de Lado de la Oferta (SSP)Plataforma del Lado de la Demanda (PLD)Plataformas de Ciencia de DatosPlaywrightPLDPlomo envejecidoPlomo Envejecido RecicladoPor favor, traduce el siguiente texto en inglés al español y devuelve solo la traducción. Nota: no escape los símbolos especiales en código.Pre-cargaPre-licitaciónPrecio BasePrecio Mínimo de Venta (MAP)PrecisiónPresentaciones de patentesPrevención de botsPrevención de fraudePrevención de Pérdida de Datos (DLP)Prevenir ataques DDOSPrevenir RobotsPrivacidad DiferencialProcesamiento del Lenguaje NaturalPromociónProtección de datosProtección de marca registradaProtección DNSProtocolo de redProtocolo de Transferencia de HipertextoProveedor de Servicios de InternetProveniencia de los datosProxies de ISPProxies Residenciales RotativosProxies VirgenProxyProxy AnónimoProxy de retroconexiónProxy DNSProxy inversoProxy ResidencialProxy TransparenteProxys MóvilesProxys rotativosPrueba de PenetraciónPruebas de APIPublicidad con botsPublicidad maliciosaPunto de conexión de APIPunto finalPuntuación de CalidadPuppeteerPython Requests
R
60 términos
RAGRancho DDoS Ransom DDoSRaspadoRaspado de API ocultaRaspado de Métricas de ResilienciaRaspado de webRaspado DinámicoRaspado en contenedoresRaspado EstáticoRaspadorRastreo de datosRastreo de la webRDFaReCaptchaRecolección de metadatosReconciliación de DatosReconocimiento Óptico de CaracteresRecopilación de datosRecopilación de datos de entrenamiento de IARecorriendo el DOMRecuperación de datosRecuperación de datosRecuperación de InformaciónRecuperarRed de AnunciosRed de botsRed de Entrega de ContenidosRed Privada VirtualRedirección HTTPRedirecciones forzadasReducción de DatosReembolso de comercio electrónicoReferenteRefinamiento de datosRegistro de dominios con errores tipográficosRegistros de DatosRegla de Privacidad de HIPAARenderizadoRenderizado de JavaScriptRenderizado DinámicoRendimientoReseñas FalsasReseñas y CalificacionesResiliencia de datosResolución de entidadesRespuesta del servidorRespuesta en Tiempo RealRespuesta HTTPResultado MaloResultados DirectosRetención de datosReutilización de DatosRGPD (Reglamento General de Protección de Datos)RoasRobots TextoROI (Rentabilidad de la Inversión)Romper el selloRootearRotación de IPRvest
S
54 términos
SaasSast Iast DastScrapyScrapySharpSegmentación geográficaSeguridad de AplicacionesSeguridad de Aplicaciones WebSeguridad de bases de datosSeguridad de contenedoresSeguridad de datosSeguridad de la APISeguridad de la nubeSeguridad de RedesSelector de CSSSelector de XPathSeleniumSelenium Controlador de NavegadorSelenium RedSemántica de DatosSerialización de datosServicioServicio de datosServicio totalmente gestionadoServicios de Transformación de DatosServicios Financieros CiberseguridadServidor de datosSIEMsimple titleSistema de Nombres de DominioSistemas de Apoyo a la Toma de DecisionesSitios web de pruebaSivtSMBSoftware de Protección contra BotsSolicitudSolicitud de comandos de WindowsSolicitud GETSolicitud HTTPSolicitud POSTSolicitud síncronaSolicitudes (Biblioteca)Solicitudes de anuncios duplicadosSoltarSoluciones de CiberseguridadSopa BonitasospechosoSQLSubconjunto de DatosSubred de ProxySumidero de DatosSuplantaciónSuplantación de dispositivo (Ua Suplantación)Suplantación de dominioSuplantación de SDK
T
32 términos
Tarea del ActorTarea personalizadaTasa de clicsTasa de ÉxitoTasa de solicitudTasas de fraudeTaxonomía de DatosTaxonomía de erroresTécnica de HoneypotTendencias de fraudeTeoría de la InformaciónTerminal de UbuntuTérminos de Servicio de la APITérminos de Uso y Políticas de PrivacidadTiempo de esperaTls Ja3 Colisión de hashtokenToma de cuenta AtoTrabajadores de la WebTráfico de botsTráfico de Centro de DatosTráfico de Proxy No VálidoTráfico de sitio webTráfico Inválido (IVT)Tráfico inválido sofisticadoTransacción HTTPTransformaciónTransmisión de datosTransmutación de DatosTransparenciaTubería de DatosTubería de Datos de LLM
X
1 término
Z
2 términos