Geração Aumentada por Recuperação
RAG significa Geração Complementada por Recuperação, uma arquitetura de IA que combina recuperação com modelagem gerativa.
Definição
Geração Complementada por Recuperação (RAG) é um quadro de IA híbrido que melhora um modelo gerativo incorporando um sistema de recuperação externo para buscar informações relevantes em tempo real. Quando uma consulta é recebida, o sistema procura uma base de conhecimento ou corpus para dados contextualmente pertinentes e alimenta esses resultados no modelo gerativo para moldar sua saída. Esse abordagem fundamenta as respostas geradas em informações fáticas ou atualizadas, reduzindo alucinações e ampliando o conhecimento efetivo do modelo além de seus dados de treinamento. O RAG é amplamente utilizado em sistemas onde precisão e relevância são críticas, como busca empresarial, assistentes de QA e fluxos de trabalho de resumo de documentos. Ele desacopla o armazenamento de conhecimento da componente gerativa, permitindo atualizações na base de conhecimento sem retrainar o modelo principal.
Vantagens
- Melhora a precisão fática ao fundamentar a geração em fontes de dados reais.
- Permite respostas atualizadas sem retrainar o modelo gerativo.
- Reduz alucinações comuns em saídas de LLMs autônomos.
- Escalável para grandes corpora de conhecimento por meio de camadas de recuperação eficientes.
- Integração flexível com diversos sistemas de busca e indexação vetorial.
Desvantagens
- Mais complexo arquiteturalmente do que sistemas gerativos simples.
- Etapas de recuperação podem adicionar latência à geração de respostas.
- Qualidade depende do índice de recuperação e da estratégia de fragmentação de documentos.
- Requer manter e atualizar armazenamentos de conhecimento externos.
- Sobrecarga de integração para bancos de dados vetoriais ou motores de busca.
Casos de uso
- Chatbots de IA que respondem com conhecimento específico de domínio atual.
- Assistentes de busca empresarial que sintetizam documentos sob demanda.
- Atendimento ao cliente automatizado que utiliza bases de conhecimento internas.
- Ferramentas de geração de conteúdo fundamentadas em fontes de dados específicas.
- Sistemas de resumo de documentos que usam corpora externos para contexto.