Architecture & CoreDecisions
0006 ai pricing and usage billing engine
ADR 0006: AI Pricing and Usage-based Billing Engine
Status
Aceito (2026-02-21)
Contexto
O projeto precisava de uma forma de monetizar o consumo intensivo de IA (tokens) e oferecer inteligência de mercado aos lojistas B2B. A telemetria já capturava o custo operacional (tokens), mas não havia um repasse automático ou uma ferramenta de auxílio à precificação dinâmica.
Decisão
Implementamos um sistema dual:
- Inteligência de Precificação (Hub): O
PricingServiceutiliza o modelo Llama 3 para cruzar dados de custo de fornecedores (Brasil Warehouse) e preços de concorrência (Mercado Livre), gerando sugestões de markup ideal persistidas diretamente no D1. - Faturamento por Uso (Worker): Integramos o
Stripe Metered Billing. O consumo de tokens é agregado a cada 24h e enviado via cron job para o Stripe usando a API deusage_records.
Racional Arquitetural
- Separação de Preocupações: O processamento pesado de IA (inferência e análise) fica no
agent-hub. O worker apenas orquestra o faturamento. - Eficiência Financeira: O faturamento metered permite que o O-Connector escale conforme o uso dos clientes, cobrindo os custos de infraestrutura de IA proporcionalmente.
- UX: Integramos botões de ação imediata no Dashboard, permitindo que a "IA sugira e o humano valide/aplique".
Consequências
- Positivas: Ciclo de monetização automatizado; maior valor agregado ao produto B2B com sugestões inteligentes.
- Negativas: Dependência da precisão do Llama 3 (mitigada pelo racional detalhado exibido ao usuário); necessidade de mapear manualmente os
stripeMeteredSubscriptionItemIdpara clientes existentes (estratégia de ativação manual inicial).
Alternativas Consideradas
- Venda de Créditos: Descartada por causar fricção no checkout. Optamos pelo pós-pago baseado em consumo real.
- Preço Fixo de Assinatura: Insustentável para uso pesado de IA (tokens são caros).