Skip to main content

O que é RAG?

RAG (Retrieval-Augmented Generation) é uma técnica que combina busca semântica com geração de texto por IA. Em vez de o modelo inventar respostas, ele consulta sua base de conhecimento real e gera respostas fundamentadas.

Como funciona no SAN Talk AI

1. Base de conhecimento

Seus documentos, FAQs e conteúdo de sites são processados e armazenados em um banco de dados vetorial (embeddings). Cada pedaço de conteúdo vira um “chunk” com metadados.

2. Busca semântica

Quando você envia uma consulta, o sistema converte o texto em um vetor e busca os chunks mais similares — mesmo que usem palavras diferentes.
“Como devolver um produto?” encontra conteúdo sobre “política de devolução” mesmo sem usar as mesmas palavras.

3. Geração de resposta (opcional)

Se você usar returnMode: "ai_generated_answer", um modelo de IA gera uma resposta natural usando os chunks encontrados como base.

Conceitos-chave

Source Types

TipoDescrição
documentDocumentos carregados (PDF, DOCX, etc.)
qaPares de pergunta e resposta cadastrados
websiteConteúdo extraído de sites via crawling

Audience

AudienceUso
ai_agentAgentes de IA que atendem clientes diretamente
copilotAssistentes que ajudam atendentes humanos
strategistAnálise estratégica e insights

Score Threshold

O scoreThreshold (0 a 1) define o nível mínimo de relevância:
  • 0.5 - 0.6: Mais resultados, menor precisão
  • 0.7 - 0.8: Equilíbrio entre quantidade e qualidade (recomendado)
  • 0.9+: Apenas resultados altamente relevantes

Reranking

Quando useRerank: true, os resultados passam por um segundo modelo que reordena por relevância real.

Modos de retorno

chunks_only

Retorna apenas os chunks brutos. Útil quando você quer processar os resultados no seu próprio sistema.

ai_generated_answer

Retorna os chunks e uma resposta gerada por IA.
O modo ai_generated_answer é mais lento pois inclui a etapa de geração. Use chunks_only quando a latência for crítica.