OBrain Sovereign Engine
Architecture & CoreDecisions

0006 ai pricing and usage billing engine

ADR 0006: AI Pricing and Usage-based Billing Engine

Status

Aceito (2026-02-21)

Contexto

O projeto precisava de uma forma de monetizar o consumo intensivo de IA (tokens) e oferecer inteligência de mercado aos lojistas B2B. A telemetria já capturava o custo operacional (tokens), mas não havia um repasse automático ou uma ferramenta de auxílio à precificação dinâmica.

Decisão

Implementamos um sistema dual:

  1. Inteligência de Precificação (Hub): O PricingService utiliza o modelo Llama 3 para cruzar dados de custo de fornecedores (Brasil Warehouse) e preços de concorrência (Mercado Livre), gerando sugestões de markup ideal persistidas diretamente no D1.
  2. Faturamento por Uso (Worker): Integramos o Stripe Metered Billing. O consumo de tokens é agregado a cada 24h e enviado via cron job para o Stripe usando a API de usage_records.

Racional Arquitetural

  • Separação de Preocupações: O processamento pesado de IA (inferência e análise) fica no agent-hub. O worker apenas orquestra o faturamento.
  • Eficiência Financeira: O faturamento metered permite que o O-Connector escale conforme o uso dos clientes, cobrindo os custos de infraestrutura de IA proporcionalmente.
  • UX: Integramos botões de ação imediata no Dashboard, permitindo que a "IA sugira e o humano valide/aplique".

Consequências

  • Positivas: Ciclo de monetização automatizado; maior valor agregado ao produto B2B com sugestões inteligentes.
  • Negativas: Dependência da precisão do Llama 3 (mitigada pelo racional detalhado exibido ao usuário); necessidade de mapear manualmente os stripeMeteredSubscriptionItemId para clientes existentes (estratégia de ativação manual inicial).

Alternativas Consideradas

  • Venda de Créditos: Descartada por causar fricção no checkout. Optamos pelo pós-pago baseado em consumo real.
  • Preço Fixo de Assinatura: Insustentável para uso pesado de IA (tokens são caros).

On this page