Quando uma empresa decide avaliar agentes de ia, a primeira pergunta é sempre a mesma: quanto custa? A resposta honesta é "depende" — mas isso não ajuda ninguém a planejar orçamento. Este artigo abre a caixa-preta dos preços do mercado brasileiro em 2026, com faixas reais, componentes de custo e cálculos de ROI baseados em projetos que entregamos.
Os 4 componentes de custo de um projeto de agente de IA
- Setup inicial (projeto, construção, go-live)
- Infraestrutura e plataforma (recorrente)
- Consumo de LLM e APIs (variável)
- Manutenção e evolução contínua
Componente 1: setup inicial
Engloba discovery, arquitetura, integrações, construção de fluxos, testes e deploy. É o que você paga uma vez para ter o agente no ar.
| Perfil | Escopo típico | Faixa de preço |
|---|---|---|
| Básico | 1 fluxo, FAQ + handoff humano | R$ 3.500 – R$ 9.000 |
| Intermediário | 3-5 fluxos, RAG, 1 CRM | R$ 12.000 – R$ 35.000 |
| Avançado | Multi-agente, ERP, pagamentos, RAG robusto | R$ 40.000 – R$ 120.000 |
| Enterprise | 10+ integrações, SLA 24/7, compliance rigoroso | R$ 150.000 – R$ 500.000+ |
O que influencia o setup
- Quantidade e qualidade de integrações
- Complexidade da base de conhecimento
- Número de fluxos distintos
- Requisitos de compliance (LGPD, PCI, HIPAA)
- Idiomas suportados
- SLA e disponibilidade
Componente 2: plataforma e hospedagem
Custo recorrente mensal com infraestrutura. Inclui banco de dados, banco vetorial, servidores de aplicação, filas, observabilidade.
- Operação enxuta (até 5K conversas/mês): R$ 400 a R$ 1.200
- Operação média (5K-50K conversas/mês): R$ 1.200 a R$ 3.500
- Operação alta (50K-500K conversas/mês): R$ 3.500 a R$ 12.000
- Operação enterprise (500K+ conversas/mês): R$ 12.000+
Componente 3: LLM e APIs
Variável, baseado em volume de interações. Os modelos mais usados no Brasil:
| Modelo | Preço médio (US$/1M tokens) | Qualidade PT-BR | Latência |
|---|---|---|---|
| GPT-4o-mini | 0,15 input / 0,60 output | Muito boa | 300-600ms |
| Claude Haiku 3.5 | 0,25 / 1,25 | Excelente | 400-800ms |
| Gemini 1.5 Flash | 0,075 / 0,30 | Muito boa | 350-700ms |
| GPT-4o | 2,50 / 10,00 | Excelente | 500-1200ms |
| Claude Sonnet | 3,00 / 15,00 | Excelente | 600-1400ms |
Custo por conversa típica (~3.000 tokens): R$ 0,05 a R$ 0,30. Em operações de alto volume, otimização de prompt e uso estratégico de modelos pequenos pode reduzir custo em 40-60%.
Componente 4: WhatsApp Business API
Se o agente opera no WhatsApp (caso mais comum no Brasil), há custo por conversa pela Meta:
- Conversa de utilidade: R$ 0,05 a R$ 0,12
- Conversa de autenticação: R$ 0,02 a R$ 0,06
- Conversa de marketing: R$ 0,18 a R$ 0,35
- Conversa de serviço (iniciada pelo cliente): R$ 0,00
Operações bem desenhadas puxam o cliente para iniciar a conversa (gratuita para a empresa), reduzindo custo substancialmente.
Componente 5: manutenção e evolução
Agente bem mantido gera 30-40% mais valor que agente esquecido no deploy. Orçamento típico:
- Manutenção básica (correções, updates): 15-20% do setup ao ano
- Evolução (novos fluxos, integrações): 25-40% do setup ao ano
- Total ano a ano: 40-60% do setup
Cenário completo: quanto custa rodar 1 ano
Pequena empresa (2.000 conversas/mês)
- Setup: R$ 8.000
- Plataforma/ano: R$ 8.400
- LLM/ano: R$ 2.400
- WhatsApp API/ano: R$ 1.800
- Manutenção/ano: R$ 3.200
- Total ano 1: R$ 23.800
- Total ano 2: R$ 15.800
Média empresa (20.000 conversas/mês)
- Setup: R$ 28.000
- Plataforma/ano: R$ 28.800
- LLM/ano: R$ 24.000
- WhatsApp API/ano: R$ 18.000
- Manutenção/ano: R$ 11.200
- Total ano 1: R$ 110.000
- Total ano 2: R$ 82.000
Grande empresa (150.000 conversas/mês)
- Setup: R$ 95.000
- Plataforma/ano: R$ 96.000
- LLM/ano: R$ 180.000
- WhatsApp API/ano: R$ 135.000
- Manutenção/ano: R$ 38.000
- Total ano 1: R$ 544.000
- Total ano 2: R$ 449.000
Como calcular ROI corretamente
Ganhos a contabilizar:
- Redução de pessoal em atendimento (custo CLT × produtividade ganha)
- Aumento de conversão (receita adicional × margem)
- Recuperação de carrinho abandonado (no e-commerce)
- NPS/retenção (LTV adicional)
- Redução de erros operacionais
Fórmula simplificada:
ROI (%) = ((Ganhos anuais - Custo anual) / Custo anual) × 100
Payback médio observado em nossos projetos: 4,7 meses. Projetos mal dimensionados ou com expectativa errada podem pagar em 12-18 meses.
Como não tomar prejuízo
- Exija diagnóstico formal antes do contrato
- Defina KPIs mensuráveis desde a proposta
- Peça case com empresa do seu porte/setor
- Negocie cláusula de SLA com penalidade
- Garanta posse do código e das bases
- Faça piloto controlado antes de escala
- Reserve 20% do orçamento para evolução
Comparativo: construir internamente vs contratar especialista
| Dimensão | Time interno | Parceiro especializado |
|---|---|---|
| Custo ano 1 | R$ 600k – R$ 1,2M (2-3 pessoas sênior) | R$ 100k – R$ 300k |
| Time-to-market | 6-12 meses | 2-4 meses |
| Conhecimento acumulado | Fica na empresa | Transferência estruturada |
| Risco de turnover | Alto (talento escasso) | Baixo |
| Escala global | Limitada pelo time | Elástica |
Perguntas frequentes sobre custos de agentes de IA
Dá para começar com menos de R$ 10 mil?
Sim, para operações pequenas com 1 fluxo simples. Use plataformas no-code + API direta de LLM. Limite: não aguenta escala nem casos complexos.
O custo de LLM vai cair mais?
Tendência de queda contínua (historicamente 10x ao ano). Planeje ROI com preço atual e ganhe se cair.
Quanto custa migrar provider de LLM?
Com arquitetura bem desenhada, R$ 2.000-8.000 de trabalho técnico. Sem arquitetura abstraída, pode exigir refactor grande.
Vale a pena fine-tuning?
Raramente. RAG bem feito entrega 90% do valor por 5% do custo. Fine-tuning só em casos muito específicos de domínio fechado.
Como negociar com fornecedor?
Exija escopo detalhado em horas, lista nominal de quem vai trabalhar, cláusula de SLA e posse do código. Fuja de propostas vagas.
Posso pagar por resultado?
Alguns parceiros aceitam modelo híbrido (fixo + variável por métrica). Verifique quem assume o risco da integração e da base de conhecimento.
Conclusão
Custo de agentes de ia deixou de ser barreira — virou investimento com retorno mensurável e previsível. O que diferencia projetos rentáveis de prejuízos é disciplina na definição de escopo, escolha do parceiro e métricas claras desde o dia um.
Quer um orçamento personalizado com base em suas métricas reais? fale com um especialista IA365 e receba em 48h uma proposta detalhada com TCO (Total Cost of Ownership) de 3 anos.