Skip to main content
A página Consumo de IA mostra onde os créditos da Empresa estão indo: quais funcionalidades usaram mais tokens, em quais Unidades, em quais conversas e quanto cada modelo de IA custou. É a fonte principal para entender o custo da operação e identificar pontos para otimizar. A página fica em Configurações → Consumo de IA (talk.saninternet.com/settings/billing/consumption).

Conceitos rápidos

TermoO que é
TokenUnidade que os modelos de IA usam para contar texto. Aproximadamente 0,75 palavra em português.
Tokens de entradaTudo que o Talk envia para a IA (contexto, instruções, base de conhecimento, histórico da conversa).
Tokens de saídaTudo que a IA gera em resposta.
ChamadaUma requisição à IA. Uma conversa longa pode ter dezenas de chamadas.
CategoriaFunção que usou a IA (Copilot, Scout, RAG, Atendimento Passivo, Campanha, etc.).
Custo USDCusto real em dólares cobrado pelos provedores (OpenAI, Anthropic, etc.).

Filtros do topo

Período

OpçãoJanela considerada
DiaHoje (últimas 24h).
SemanaÚltimos 7 dias.
MêsMês corrente (do dia 1 até hoje).
PersonalizadoDatas de início e fim escolhidas pelo usuário.

Filtro por Unidade

Logo abaixo dos filtros aparecem chips de cada Unidade da Empresa com o custo USD daquela Unidade. Cliques alternam a inclusão/exclusão. Nenhum selecionado mostra o total da Empresa; selecionar uma ou mais filtra toda a tela (KPIs, gráfico, tabelas) só para aquelas Unidades.
Use o filtro de Unidades para responder perguntas do tipo: “Qual loja está consumindo mais IA?” ou “Quanto a Unidade X gastou esta semana?”.

KPIs no topo

Quatro grandes cards resumem o consumo do período selecionado:
KPIConteúdo
Tokens consumidosTotal de entrada + saída no período, com badge de variação vs. mês anterior (apenas em modo Mês). Mostra a quebra entrada/saída e uma barra lateral de progresso do mês.
Custo USDTotal em dólares no período, com badge de variação vs. mês anterior.
Chamadas de IAQuantidade total de requisições aos modelos.
Conversas com IAQuantidade de conversas que tiveram chamadas de IA, mais tokens totais e média por conversa.
A barra lateral verde-azulada do KPI de Tokens indica em que ponto do mês você está (ex.: “12/30d”). Quanto mais alto a barra, mais perto do fim do mês — útil para estimar gasto final.

Gráfico de evolução

Mostra a série diária do consumo nos últimos 7, 30 ou 90 dias (botões 7d, 30d, 90d). Dois modos de visualização:
  • Barras empilhadas: cada dia é uma barra dividida por categoria com cores fixas.
  • Linha: total agregado por dia — mais limpo para ver tendência.
Abaixo do gráfico há uma legenda interativa: clicar em uma categoria oculta/exibe ela no gráfico. Útil para isolar comportamento de uma função específica.

Onde os tokens são gastos

Painel lateral com gráfico donut (anel) mostrando a divisão do Custo USD por categoria. As mesmas cores do gráfico de evolução são usadas para consistência visual. Abaixo do donut, lista detalhada por categoria, ordenada pelo maior custo, mostrando:
  • Bolinha colorida (cor da categoria) + nome
  • Tokens totais e número de chamadas
  • Minutos de áudio (quando aplicável — Transcrição)
  • Custo USD
  • Percentual sobre o total
  • Barra de progresso proporcional

Categorias monitoradas

CategoriaQuando aparece
PASSIVE_ATTENDANTConversas resolvidas pelo Atendimento Passivo.
COPILOTSugestões de resposta do Copilot.
CAMPAIGNGeração de mensagens para Campanhas.
CONVERSATION_SUMMARYAnálise do Scout ao final de cada conversa.
RAG_RETRIEVALBusca na Base de Conhecimento durante uma conversa.
RAG_INDEXINGIndexação de documentos, sites e Q&A na Base de Conhecimento.
TRANSCRIPTIONTranscrição de áudios recebidos no WhatsApp.
ATTENDANT_FEEDBACKGeração de feedback de atendentes.
INTAKECadastro e qualificação inicial do cliente.
PROCESS_MAPPINGMapeamento automático de processos da operação.
CHATOutras interações do agente de IA.

Detalhes por modelo de IA

Se a empresa usa múltiplos modelos (OpenAI, Anthropic, etc.), o botão Detalhes por modelo de IA abre um modal com:

Consumo por modelo

Tabela com colunas: Modelo, Provider, Processo (categoria), Entrada, Saída, Custo USD e Chamadas. Mostra exatamente quanto cada combinação modelo + processo consumiu nos últimos 90 dias.

Tabela de preços

Lista todos os modelos disponíveis e o custo unitário cobrado pelo provedor:
  • $ / 1M Entrada — preço por milhão de tokens de entrada.
  • $ / 1M Saída — preço por milhão de tokens de saída.
  • $ / min Áudio — preço por minuto de áudio (modelos de transcrição).
Esta tabela é a referência de como o Talk converte tokens em custo. Modelos mais caros são reservados para tarefas mais complexas (raciocínio, geração longa) e modelos baratos para tarefas simples (classificação, summarization curta).

Consumo por conversa

Tabela na parte inferior listando cada conversa que envolveu IA no período:
ColunaDescrição
ContatoNome do contato (ou número do JID) e ID curto da conversa.
CategoriasQuais categorias de IA foram usadas nessa conversa.
Msgs IAMensagens geradas por IA / Total de mensagens da conversa.
ChamadasQuantidade de chamadas à IA.
TokensSoma de entrada + saída.
CustoCusto USD da conversa.
ÚltimaData e hora da última chamada de IA na conversa.

Filtros da tabela

  • Chips de categoria acima da tabela (Todas + Top 7 categorias do período).
  • Campo de busca para filtrar por nome do contato, telefone ou ID da conversa.
  • Paginação configurável (5, 10, 20, 50 por página).

Drill-down em uma conversa

Clicar em uma linha abre um drawer lateral com:
  • Detalhes da conversa (contato, canal, atendente, datas).
  • Todas as mensagens trocadas, igual à Central de Conversas.
  • Botão Compartilhar para copiar um link da conversa para colar em chats internos.
Esse drawer é o mesmo da Central de Conversas, trazido para facilitar a investigação direto da página de consumo.

Como interpretar os dados

  • Pico de tokens em um dia específico sem aumento proporcional de conversas → provavelmente alguma operação batch (re-indexação de base, atualização de campanha massiva).
  • Categoria CONVERSATION_SUMMARY com participação alta → muitas conversas estão sendo encerradas e analisadas pelo Scout. Pode ser bom revisar se vale ajustar a configuração em Regras de Conversa.
  • RAG_RETRIEVAL alto → a base de conhecimento está sendo bastante consultada. Verifique se faz sentido com o volume de conversas; se desproporcional, talvez seja preciso afinar a Base de Conhecimento.
  • Custo médio por conversa alto (Média $X/conversa no topo da tabela) → reveja o tamanho do contexto enviado à IA ou troque modelos para versões mais econômicas se a qualidade permitir.
Use a comparação vs. mês anterior dos KPIs como o primeiro sinal: variações grandes (> 30%) merecem investigação detalhada na tabela “Onde os tokens são gastos”.