Consumo de IA - Talk AI

A página Consumo de IA mostra onde os créditos da Empresa estão indo: quais funcionalidades usaram mais tokens, em quais Unidades, em quais conversas e quanto cada modelo de IA custou. É a fonte principal para entender o custo da operação e identificar pontos para otimizar. A página fica em Configurações → Consumo de IA (talk.saninternet.com/settings/billing/consumption).

Conceitos rápidos

Termo	O que é
Token	Unidade que os modelos de IA usam para contar texto. Aproximadamente 0,75 palavra em português.
Tokens de entrada	Tudo que o Talk envia para a IA (contexto, instruções, base de conhecimento, histórico da conversa).
Tokens de saída	Tudo que a IA gera em resposta.
Chamada	Uma requisição à IA. Uma conversa longa pode ter dezenas de chamadas.
Categoria	Função que usou a IA (Copilot, Scout, RAG, Atendimento Passivo, Campanha, etc.).
Custo USD	Custo real em dólares cobrado pelos provedores (OpenAI, Anthropic, etc.).

Filtros do topo

Período

Opção	Janela considerada
Dia	Hoje (últimas 24h).
Semana	Últimos 7 dias.
Mês	Mês corrente (do dia 1 até hoje).
Personalizado	Datas de início e fim escolhidas pelo usuário.

Filtro por Unidade

Logo abaixo dos filtros aparecem chips de cada Unidade da Empresa com o custo USD daquela Unidade. Cliques alternam a inclusão/exclusão. Nenhum selecionado mostra o total da Empresa; selecionar uma ou mais filtra toda a tela (KPIs, gráfico, tabelas) só para aquelas Unidades.

Use o filtro de Unidades para responder perguntas do tipo: “Qual loja está consumindo mais IA?” ou “Quanto a Unidade X gastou esta semana?”.

KPIs no topo

Quatro grandes cards resumem o consumo do período selecionado:

KPI	Conteúdo
Tokens consumidos	Total de entrada + saída no período, com badge de variação vs. mês anterior (apenas em modo Mês). Mostra a quebra entrada/saída e uma barra lateral de progresso do mês.
Custo USD	Total em dólares no período, com badge de variação vs. mês anterior.
Chamadas de IA	Quantidade total de requisições aos modelos.
Conversas com IA	Quantidade de conversas que tiveram chamadas de IA, mais tokens totais e média por conversa.

A barra lateral verde-azulada do KPI de Tokens indica em que ponto do mês você está (ex.: “12/30d”). Quanto mais alto a barra, mais perto do fim do mês — útil para estimar gasto final.

Gráfico de evolução

Mostra a série diária do consumo nos últimos 7, 30 ou 90 dias (botões 7d, 30d, 90d). Dois modos de visualização:

Barras empilhadas: cada dia é uma barra dividida por categoria com cores fixas.
Linha: total agregado por dia — mais limpo para ver tendência.

Abaixo do gráfico há uma legenda interativa: clicar em uma categoria oculta/exibe ela no gráfico. Útil para isolar comportamento de uma função específica.

Onde os tokens são gastos

Painel lateral com gráfico donut (anel) mostrando a divisão do Custo USD por categoria. As mesmas cores do gráfico de evolução são usadas para consistência visual. Abaixo do donut, lista detalhada por categoria, ordenada pelo maior custo, mostrando:

Bolinha colorida (cor da categoria) + nome
Tokens totais e número de chamadas
Minutos de áudio (quando aplicável — Transcrição)
Custo USD
Percentual sobre o total
Barra de progresso proporcional

Categorias monitoradas

Categoria	Quando aparece
PASSIVE_ATTENDANT	Conversas resolvidas pelo Atendimento Passivo.
COPILOT	Sugestões de resposta do Copilot.
CAMPAIGN	Geração de mensagens para Campanhas.
CONVERSATION_SUMMARY	Análise do Scout ao final de cada conversa.
RAG_RETRIEVAL	Busca na Base de Conhecimento durante uma conversa.
RAG_INDEXING	Indexação de documentos, sites e Q&A na Base de Conhecimento.
TRANSCRIPTION	Transcrição de áudios recebidos no WhatsApp.
ATTENDANT_FEEDBACK	Geração de feedback de atendentes.
INTAKE	Cadastro e qualificação inicial do cliente.
PROCESS_MAPPING	Mapeamento automático de processos da operação.
CHAT	Outras interações do agente de IA.

Detalhes por modelo de IA

Se a empresa usa múltiplos modelos (OpenAI, Anthropic, etc.), o botão Detalhes por modelo de IA abre um modal com:

Consumo por modelo

Tabela com colunas: Modelo, Provider, Processo (categoria), Entrada, Saída, Custo USD e Chamadas. Mostra exatamente quanto cada combinação modelo + processo consumiu nos últimos 90 dias.

Tabela de preços

Lista todos os modelos disponíveis e o custo unitário cobrado pelo provedor:

$ / 1M Entrada — preço por milhão de tokens de entrada.
$ / 1M Saída — preço por milhão de tokens de saída.
$ / min Áudio — preço por minuto de áudio (modelos de transcrição).

Esta tabela é a referência de como o Talk converte tokens em custo. Modelos mais caros são reservados para tarefas mais complexas (raciocínio, geração longa) e modelos baratos para tarefas simples (classificação, summarization curta).

Consumo por conversa

Tabela na parte inferior listando cada conversa que envolveu IA no período:

Coluna	Descrição
Contato	Nome do contato (ou número do JID) e ID curto da conversa.
Categorias	Quais categorias de IA foram usadas nessa conversa.
Msgs IA	Mensagens geradas por IA / Total de mensagens da conversa.
Chamadas	Quantidade de chamadas à IA.
Tokens	Soma de entrada + saída.
Custo	Custo USD da conversa.
Última	Data e hora da última chamada de IA na conversa.

Filtros da tabela

Chips de categoria acima da tabela (Todas + Top 7 categorias do período).
Campo de busca para filtrar por nome do contato, telefone ou ID da conversa.
Paginação configurável (5, 10, 20, 50 por página).

Drill-down em uma conversa

Clicar em uma linha abre um drawer lateral com:

Detalhes da conversa (contato, canal, atendente, datas).
Todas as mensagens trocadas, igual à Central de Conversas.
Botão Compartilhar para copiar um link da conversa para colar em chats internos.

Esse drawer é o mesmo da Central de Conversas, trazido para facilitar a investigação direto da página de consumo.

Como interpretar os dados

Pico de tokens em um dia específico sem aumento proporcional de conversas → provavelmente alguma operação batch (re-indexação de base, atualização de campanha massiva).
Categoria CONVERSATION_SUMMARY com participação alta → muitas conversas estão sendo encerradas e analisadas pelo Scout. Pode ser bom revisar se vale ajustar a configuração em Regras de Conversa.
RAG_RETRIEVAL alto → a base de conhecimento está sendo bastante consultada. Verifique se faz sentido com o volume de conversas; se desproporcional, talvez seja preciso afinar a Base de Conhecimento.
Custo médio por conversa alto (Média $X/conversa no topo da tabela) → reveja o tamanho do contexto enviado à IA ou troque modelos para versões mais econômicas se a qualidade permitir.

Use a comparação vs. mês anterior dos KPIs como o primeiro sinal: variações grandes (> 30%) merecem investigação detalhada na tabela “Onde os tokens são gastos”.

​Conceitos rápidos

​Filtros do topo

​Período

​Filtro por Unidade

​KPIs no topo

​Gráfico de evolução

​Onde os tokens são gastos

​Categorias monitoradas

​Detalhes por modelo de IA

​Consumo por modelo

​Tabela de preços

​Consumo por conversa

​Filtros da tabela

​Drill-down em uma conversa

​Como interpretar os dados

Conceitos rápidos

Filtros do topo

Período

Filtro por Unidade

KPIs no topo

Gráfico de evolução

Onde os tokens são gastos

Categorias monitoradas

Detalhes por modelo de IA

Consumo por modelo

Tabela de preços

Consumo por conversa

Filtros da tabela

Drill-down em uma conversa

Como interpretar os dados