코스 목록 / Monitoring
Prometheus 메트릭 설계와 알림 피로 줄이기
메트릭 네이밍, 레이블 카디널리티, 알림 그룹핑을 데이터 파이프라인에 맞게 조정합니다.
커리큘럼 서사
알림 피로는 사람의 문제이기도 하지만, 대부분은 메트릭 설계 문제입니다. 레이블 전략과 레코딩 룰을 사용해 소음을 줄이는 루틴을 만듭니다.
포함 요소
- 메트릭 네이밍 워크시트
- 레코딩 룰 실습 세트
- 알림 라우팅 템플릿
- 주간 리뷰 5회
러너 아웃컴
- 파이프라인별 최소 메트릭 세트를 정의합니다.
- 알림 그룹핑으로 중복 호출을 줄입니다.
- 레이블 카디널리티 경고를 사전에 탐지합니다.
코스 리드
남기솔
관측 플랫폼 운영 7년.
코호트 메모
`prometheus-alert-fatigue` 모듈의 레코딩 룰 예시가 알림 소음을 줄이는 데 바로 적용됐습니다.
세부 FAQ
아키텍처 소개만 하며, 단일 클러스터 기준으로 실습합니다.