Prometheus estranho: detalhes sobre process_cpu_seconds_total
Objetivo: Detectar causa de comportamento estranho em métrica no Prometheus. Surgiu no trabalho uma situação curiosa com a monitoração de uma aplicação. No painel de uso de CPU disponível no dashboard Grafana, aparecia um gráfico subindo sem parar com números absurdos. A métrica utilizada é process_cpu_seconds_total coletada e disponibilizada pelo client Python do Prometheus. Esse client coleta a informação do arquivo /proc/[pid]/statstat onde pid é o id do processo monitorado. ...