Fase 8 — Deploy e operação (S)
A Fase 8 leva a aplicação a produção e mantém a operação. A IA executa o checklist pré-deploy, monitora SLA e conformidade, alerta sobre anomalias e sugere ações corretivas. Decisões de deploy, rollback e remediação seguem com aprovação humana.
Etapa 8.1 · Checklist automático pré-deploy
Seção intitulada “Etapa 8.1 · Checklist automático pré-deploy”Acionamento: todos os PRs aprovados, Fase 6/7 encerradas.
O que a IA verifica:
- Testes — todos passam no pipeline (unit, integração, E2E).
- Cobertura — geral acima da meta e cobertura por requisito atendida.
- Conformidade — LGPD, LAI, ISO 27001 e demais controles aplicáveis sem violação aberta.
- Bugs críticos — zero em aberto na release candidate.
- Runbook — documentação de operação publicada (procedimentos, contatos, dependências).
- Disaster recovery — backup configurado e plano de rollback documentado.
- Observabilidade — métricas, logs e alertas configurados antes do deploy.
- Configuração — variáveis de ambiente, segredos em cofre, sem dados sensíveis em arquivos.
Saída: relatório verde/amarelo/vermelho com cada item do checklist.
Validação humana obrigatória: mesmo com checklist 100% verde, o deploy é uma decisão humana — autorizada pelo Tech Lead + Gestor do contrato, com registro do tomador, data/hora e versão. Itens amarelos ou vermelhos bloqueiam o deploy até decisão explícita.
Ganho típico: 2–3 horas em verificação manual de pré-requisitos; nenhum item de checklist esquecido.
Etapa 8.2 · Monitoramento pós-deploy com IA
Seção intitulada “Etapa 8.2 · Monitoramento pós-deploy com IA”Acionamento: sistema em produção.
O que a IA faz:
- Monitora SLA — uptime, latência (p50, p95, p99), taxa de erro.
- Detecta anomalias em tempo real (desvios do padrão histórico).
- Alerta antes que o SLA seja violado (early warning).
- Sugere ações corretivas com base em padrões observados em incidentes anteriores.
- Monitora conformidade contínua — quem acessou quais documentos, exportações LAI, exclusões LGPD, tentativas não autorizadas.
Estrutura mínima do painel de monitoramento
Seção intitulada “Estrutura mínima do painel de monitoramento”| Dimensão | O que monitorar | Onde alertar |
|---|---|---|
| SLA técnico | Uptime, latência p95, taxa de erro | Datadog/New Relic/Grafana — alerta para SRE |
| Volume operacional | Documentos enviados, aprovados, rejeitados, escalados | Painel de operação — alerta para PO |
| Conformidade | Acessos, exportações, exclusões, tentativas falhas | SIEM/Elasticsearch — alerta para Encarregado de Dados e Segurança |
| Anomalias | Desvios do padrão histórico (volume, latência, padrão de uso) | Alerta para SRE com hipótese de causa |
| Saúde da IA em produção | Decisões automatizadas tomadas, taxa de discordância humana | Painel de governança de IA |
Exemplo de alerta com sugestão
Seção intitulada “Exemplo de alerta com sugestão”IA detecta: “Anomalia: 15% dos emails caíram em spam (esperado <2%). Causa provável: SPF/DKIM/DMARC desconfigurados após troca de provedor SMTP.”
IA sugere: “DevOps validar registros DNS; testar entrega em provedores principais (Gmail, Outlook); reverter para SMTP anterior se necessário.”
Validação humana obrigatória: rollback e ações corretivas com efeito em produção são decisão humana — SRE, DevOps ou Tech Lead aprovam após análise; a IA não executa rollback sozinha. Anomalias com efeito em dados pessoais ou conformidade acionam imediatamente o Encarregado de Dados.
Ganho típico: detecção contínua de problemas (não “esperar queixa de usuário”); conformidade observada em produção, não declarada em documento.
Critérios de saúde operacional
Seção intitulada “Critérios de saúde operacional”| Indicador | Limite mínimo | Frequência de revisão |
|---|---|---|
| Uptime | Acordado em SLA (ex.: ≥ 99,5%) | Diário |
| Latência p95 | Acordada em SLA (ex.: ≤ 250 ms) | Horária |
| Taxa de erro | Acordada em SLA (ex.: ≤ 0,1%) | Horária |
| Cobertura de auditoria | 100% das ações reguladas registradas | Diário |
| Tentativas não autorizadas | Tendência estável; pico → investigação | Diário |
| Anomalias abertas | Cada anomalia com responsável e prazo | Diário |
| Bugs críticos | Zero em aberto | Diário |
Indicadores fora do alvo desencadeiam revisão humana com decisão registrada (mitigação imediata, hotfix, rollback ou aceite de risco temporário).
Encerramento da operação inicial (primeiros 30 dias)
Seção intitulada “Encerramento da operação inicial (primeiros 30 dias)”| Item | Critério |
|---|---|
| Estabilidade | SLA atendido em janela observada (90% dos dias) |
| Conformidade | Zero violações de LGPD/LAI/ISO 27001 abertas |
| Backlog operacional | Bugs e ajustes identificados em produção têm responsável e prazo |
| Lições aprendidas | Documento publicado, com gatilhos para evolução do modelo |
| Transição | Operação transferida ao time de sustentação com runbooks revisados |
A partir desse ponto, o sistema entra em operação contínua, com a IA mantendo o monitoramento e o ciclo de evolução voltando à Fase 0 para cada nova demanda.
Anterior: 8 · Fases 6–7 — Qualidade e homologação · Próximo: 10 · Ganhos, ferramentas e ROI