Glossário de Extração de Dados
Um glossário abrangente de termos relacionados a web scraping, automação, resolução de CAPTCHA, extração de dados, proxies e automação de navegadores.
#
1 termo
A
61 termos
AderênciaAgente de Usuário (User-Agent) FalsificaçãoAgente do UsuárioAlfabetização em DadosAlgoritmo PageRankAlgoritmos de Backoff de TaxaAlgoritmos de Previsão de LinksAlto Desempenho em ComputaçãoAlucinação de Modelo de Linguagem de Grande EscalaAmbiente do UsuárioAmbiente VirtualAmeaças à Segurança CibernéticaAmostragemAnáliseAnálise de DadosAnálise de Dados LagrangianosAnálise de Dados PericialAnálise de HTMLAnálise de JSONAnálise de SentimentoAnálise DescritivaAnálise DiagnósticaAnálise do Tráfego de DadosAnálise HeurísticaAnálise MultidimensionalAnálise QuantitativaAnalizador de HTML/XMLAPI AssíncronaAPI do Observador de InterseçãoAPI RESTfulAprendizado de MáquinaAprendizagem FederadaAprendizagem IncrementalAranhaArbitragem de BuscaArbitragem de Marketing DigitalArbitragem de PublicidadeArbitragem de TráfegoArmazenamento de Chave e ValorArmazenamento de DocumentosArmazéns de DadosArquitetura da InformaçãoArrastar CorrerarrayAsnAssortimentoAtaque de Negação de Serviço DistribuídoAtaque de Raspagem de WebAtaques de XSS RefletidoAtenção aos detalhesatorAtor CorrerAtributo HTMLAutenticação de Dois Fatores (2FA)Autenticação Única (SSO)AutodealAutomação Robótica de ProcessosAvaliação de VulnerabilidadeAvaliações e ClassificaçõesAvisoAxios
B
28 termos
Banco de DadosBanco de Dados de VetorBancos de Dados de GrafosBelas SopasBenchmarkingBiblioteca de APIBig DataBloqueador de AnúnciosBloqueio de IPBloqueio de ScrapperBom ResultadoBot ArtificialBot de Compartilhamento de ArquivosBot de Direitos AutoraisBot de JogoBot de Mídia SocialBot de NegociaçãoBot de PublicidadeBot de Rede SocialBot de TênisBot de TransferênciaBot Recuperador de FeedBot Verificador de BacklinksBotnetBusca em LarguraBusca em ProfundidadeBusca OrgânicaBuscar
C
62 termos
C SustenidoC++Cabeçalho HTTPCacheCadeia de Valor de DadosCallbackCaminho de Pão de Açúcar Contexto de DadosCampanhaCaptchaCardagemCarga útilCDPCelularCentro de DadosCertificação PCI DSSChamada de APIChatbotChave da APICheerioChumbo EnvelhecidoChumbo Envelhecido RecicladoCibersegurança de SaúdeCicd para ScrapersClassificação de Palavras-ChaveClassificação de QualidadeClique BotClique EtiquetaClique SpammingCloudflare Portão de EntradaCodificar URLCódigo de StatusCódigo UTM (Módulo de Rastreamento Urchin)Coleta de DadosColeta de Dados de Treinamento da IAColeta de MetadadosCollyComércio eletrônicoComércio Eletrônico EstornoComputação em BordaComputação em MemóriaComunicações em Tempo Real na WebConcorrênciasConformidade SOC 2conjunto de dadosConjuntos de RegrasConsultaContador BotConversão de Formato de ArquivoCookieCPA (Custo por Ação)CPC (Custo por Clique)CPL (Custo por Cliente Potencial)CPM (Custo por Mil)CrawlarCrawleeCrawlerCrawling da WebCréditos da APICriptografia HomomórficaCriptografia no Nível de CampoCuradoria de DadosCusto de Aquisição de Tráfego (TAC)
D
32 termos
Árvore DOMDaasDados AlternativosDados da MáquinaDados da Web OcultaDados de indicação não correspondentesDados de Parte ZeroDados do ProdutoDados EstruturadosDados ExternosDados LigadosDados Não EstruturadosDados RuidososDataFrameDeduplicação de DadosDemanda Investigativa Cível (Cid)Depósitos de PatentesDescoberta de ConhecimentoDescoberta de DadosDesign de Banco de DadosDesign ResponsivoDetecção AutomáticaDetecção de BotsDetecção de Infração de Direito AutoralDetecção de Paginação AutomáticaDetecção e Prevenção de Intrusão - Glossário CapSolverDigitalização de FontesDirecionamento geográficoDisponibilidadeDLPDomdomínio
E
24 termos
E-E-A-TEconomias PotenciaisEliminar RobôsElite ProxiesEmpilhamento de anúnciosEncadeamentoEndereço IPEnganando o CliqueEnganos de Retorno de LigaçãoEngenharia ReversaEntrega de AlimentaçãoEscalandoEspião BotEsquemaEstágio de DadosEstruturação de DadosETL Extração Transformação CargaExpressão RegularExtração AutomatizadaExtração de CaracterísticasExtração de DadosExtração de NuvemExtração, Carga e TransformaçãoExtrator
F
34 termos
Fadiga de AlertaFaixasFalsificaçãoFalsificação de CookiesFalsificação de Dispositivo (Falsificação de Ua)Falsificação de domínioFalsificação de SDKFalsificação por Erro de DigitaçãoFalso PositivoFalsos LeadsFECFederação de DadosFerramentas de Visualização de DadosFila de SolicitaçõesFiltros de ConformidadeFingerprinting de Contexto de ÁudioFingerprinting de DispositivoFirewall de Aplicação Web WAFFirewall de VisitantesFluxos do KafkaFonteFormato de Dados HierárquicoFormulário BotFragmentaçãoFraude CtvFraude de AnúncioFraude de BotsFraude de CliqueFraude de EnumeraçãoFraude de ExibiçãoFraude de Marketing de AfiliadosFraude no Comércio EletrônicoFusão de DadosFusão de Dados
G
19 termos
Garantia da Qualidade dos DadosGeração Aumentada por RecuperaçãoGeração de LeadsGerenciamento de BotsGestão de Dados EmpresarialGestão de Dados MaestrosGestão de MetadadosGit BashGIVTGoGovernançaGovernança da NuvemGovernança de DadosGPTGrafo de ConhecimentoGrandes ExpectativasGrupo de Responsabilidade Confiável (TAG)Guardião de DadosGuerra Cibernética
I
26 termos
IDIdempotência - Glossário CapSolverIdentificação por Impressão Digital TLSImpersonador BotImpressão BotImpressão Digital Ja3Incompatibilidade de Agente de UsuárioIndefinidoIndexaçãoIndexação de Banco de DadosIndicadores de Desempenho ChaveIngestãoInjeção de AnúncioInjeção de CliqueInstânciaIntegração de Dados LegadosIntegridade de DadosIntegridade do Protocolo de InternetInteligência ConcorrencialInteligência de MercadoInteligência de PreçoInterface de Programação de AplicaçõesInternet das CoisasInundação de CliquesIPv4Isca de Clique
M
32 termos
MacrosMagecartMarketing de AfiliadosMarketing DigitalMarketing por E-mailMáscara de IP ou Falsificação de IPMashup de DadosMecanismos Anti-RaspagemMetadadosMétodo HTTPMétricas de VaidadeMigração de DadosMigração para a NuvemmímicoMineração de DadosModelagem de DadosModelagem DimensionalModelo de AplicativoModelo de Dados LógicoModelo de Linguagem GrandeModelo de TarefaModelo OSIModelos de Dados HíbridosMonitoramentoMonitoramento Botmonitoramento de redeMonitoramento de Usuário PrivilegiadoMonitoramento do Prometheusmonte de fenoMotor de Busca BotMotores de RenderizaçãoMySQL
N
19 termos
P
63 termos
Índice de PreçosPadrões de Clique ConsistentesPadrões de DadosPagamento por CliquePágina de ListagensPágina de Resultados do Motor de BuscaPágina DinâmicaPágina EstáticaPaginaçãoParâmetros da APIPare BotsPare os ataques DDOSParticionamentoPerfilagem de DadosPerfilagem do Comportamento do NavegadorPerícia DigitalPesquisa & Proteção Social™PhishingPipeline de DadosPipeline de Dados do LlmPlataforma de Lado da Oferta (SSP)Plataforma do Lado da Demanda (DSP)Plataformas de Ciência de DadosPlaywrightPonto de extremidadePonto de Extremidade da APIPrateleira DigitalPré-CarregamentoPré-licitaçãoPrecisãoPreço BasePreço Mínimo Anunciado (MAP)Prevenção de BotsPrevenção de FraudePrevenção de Perda de Dados (DLP)Prevenir ataques DDOSPrevenir BotsPrivacidade DiferencialPromoçãoPrompt de Comandos do WindowsProteção de DadosProteção de Marca RegistradaProteção do DNSProtocolo de RedeProtocolo de Transferência de HipertextoProvedor de Serviço de InternetProveniência de DadosProxies de Centro de DadosProxies de ISPProxies MóveisProxies Residenciais RotativosProxies RotativosProxyProxy AnônimoProxy de DatacenterProxy de RetornoProxy DNSProxy ResidencialProxy ReversoProxy TransparentePublicidade de BotPublicidade maliciosaPuppeteer
Q
1 termo
R
61 termos
RaizRansom DDoS RddosRápido Último PóRaspadorRaspador BotRaspagemRaspagem ContainerizadaRaspagem de APIs OcultasRaspagem de Métricas de ResiliênciaRaspagem de Web com Inteligência ArtificialRaspagem de Web MultithreadedRaspagem DinâmicaRaspagem EstáticaRastreamento de DadosRDFaReaproveitamento de DadosRecaptchaReconciliação de DadosRecuperação de DadosRecuperação de DadosRecuperação de InformaçãoRede de AnúnciosRede de Entrega de ConteúdoRede Privada VirtualRedirecionamento HTTPRedirecionamentos ForçadosRedução de DadosRefererRefinamento de DadosRegistros de DadosRegra de Privacidade do HIPAARelatório de DadosRemoção de VerificaçãoRenderizaçãoRenderização de JavaScriptRenderização DinâmicaRendimentoRepasso de LeadsRequisição GETRequisição POSTRequisição SíncronaRequisições (Biblioteca)Requisições PythonResiliência de DadosResolução de EntidadesResposta do ServidorResposta em Tempo RealResposta Estendida à Detecção (XDR)Resposta HTTPResultado RuimResultados DiretosRetenção de DadosRevisões FalsasRGPD (Regulamento Geral de Proteção de Dados)RoasRobôRobôs TextoRotação de IPsRoteamento de Proxy InteligenteRSI (Retorno sobre Investimento)Rvest
S
46 termos
Saida de DadosScrapyScrapySharpSegurança da APISegurança da NuvemSegurança da RedeSegurança de AplicaçãoSegurança de Aplicações WebSegurança de Banco de DadosSegurança de ContêinerSegurança de DadosSeleniumSelenium GridSelenium WebDriverSeletor CSSSeletor XpathSemântica de DadosSequestro de AfiliadoSerialização de DadosSerra de madeiraServiçoServiço de DadosServiço Totalmente GerenciadoServiços de Transformação de DadosServiços Financeiros de CibersegurançaServidor de DadosSIEMSistema de Nomes de DomínioSistemas de Apoio à DecisãoSites de DemonstraçãoSivtSMBSoftware como ServiçoSoftware de Proteção contra BotsSolicitaçãoSolicitação HTTPSolicitações de Anúncio DuplicadasSoltarSoluções de Segurança CibernéticaSpamSpam BotSQLSub-rede ProxySubconjunto de DadosSummit de Extração de Dados da WebSuspeito
T
39 termos
Tag HTMLTarefa do AtorTarefa PersonalizadaTaxa de CliquesTaxa de RequisiçãoTaxa de SucessoTaxas de FraudeTaxonomia de DadosTaxonomia de ErrosTécnica de HoneypotTelemetria AbertaTempo esgotadoTendências de FraudeTeoria da InformaçãoTerminal do UbuntuTermos de Serviço da APITermos de Uso e Políticas de PrivacidadeTeste de APITeste de PenetraçãoTeste de Segurança de AplicaçãoTLS Ja3 Colisão de HashTokenTomada de Conta AtoTrabalhadores da WebTráfego de BotTráfego de Centro de DadosTráfego de Proxy InválidoTráfego do siteTráfego Inválido (IVT)Tráfego Inválido SofisticadoTransação HTTPTransformaçãoTransmissão de DadosTransmutação de DadosTransparênciaTrecho em DestaqueTreinamentoTroca de Identificadores de AfiliadoTudo-em-um
U
3 termos
X
1 termo
Z
1 termo