시스템의 성능, 가용성, 오류를 실시간으로 감지하고, 문제가 발생할 경우 빠르게 대응할 수 있도록 도와주기 때문이다. 이를 통해 장애 예방, 성능최적화, 리소스 관리 등을 효율적으로 할 수 있다.
오픈소스 모니터링 및 경고 시스템으로, 시계열 데이터를 효과적으로 수집, 저장, 쿼리할 수 있도록 설계되었다.
데이터수집기 (Exporter)
: 다양한 시스템 및 애플리케이션에서 메트릭을 수집한다.Prometheus 서버
: 수집된 데이터를 저장하고, PromQL을 사용하여 데이터를 쿼리한다.AlertManager
: 정의된 조건에 따라 alert을 전송한다.