검증된 절감 체크리스트
자동화 도구의 정확도는 결국 점검 항목이 결정합니다. FinOps Foundation 표준 + 실무 패턴을 교차 검증해 만든 항목들로 진단합니다.
t3.medium → t3.small 처럼 한 단계 낮춰 안전 마진을 유지
m5 → m6g 는 보통 가성비 20~40% 향상
월 청구서에 보이지 않는 곳에서 새고 있는 비용
가동률 70% 이상의 안정 워크로드에 우선 적용
중단 허용 패턴을 가진 Job 만 자동 식별
같은 IOPS/처리량 기준 약 20% 절감
90일·180일 룰 + 멀티파트 미완료 정리
NAT 데이터 전송료가 청구서 상위에 잡히는 흔한 패턴
리전 간 / 외부 전송량 상위 N 을 우선 점검
자동 진단 vs 사람 검토 매트릭스
모든 항목을 10분 안에 끝낼 수는 없습니다. 어떤 항목은 ReadOnly 메타데이터만으로 즉시 결론이 나오지만, 어떤 항목은 청구서(CUR)를 정량 분석해야 보이고, 또 어떤 항목은 결국 엔지니어가 콘솔/CLI 로 직접 봐야 하거나 비즈니스 판단이 필요합니다. 단계별로 어디까지 자동화 가능한지 솔직하게 표기했습니다.
Cross-Account Role 연결 직후 SDK 로 리소스 메타데이터·CloudWatch 지표만 수집.
"즉시 삭제 가능" 한 좀비 자원과 EBS 타입처럼 결정적인 항목이 나옵니다.
CUR Parquet 을 다운받아 라인아이템 단위로 분해 — "월 ₩x 절감" 의 근거.
RI/SP 약정 시뮬레이션, NAT/CloudFront ROI 등 정량 계산이 필요한 영역.
Right-sizing 의 피크 컨텍스트, EKS 네임스페이스 매핑, NAT 트래픽 흐름 분석.
도구 출력만으로는 위험을 판단할 수 없는 항목들을 사람이 검증.
RI/SP 약정 기간, Spot 의 SLA, 야간 정지 운영 시간, 백업 보존 정책 등.
도구가 답을 줄 수 없는 영역 — 고객사 의사결정자와 함께 결정.
| 항목 | A · 10분 자동 | B · CUR 자동 | C · 엔지니어 | D · 비즈니스 | 비고 |
|---|---|---|---|---|---|
Idle 미연결 EBS · EIP · ENI | ● | ● | – | – | 즉시 삭제 가능 — 위험도 낮음 |
Idle Idle EC2 (CPU < 1%, 7일+) | ● | ● | ◐ | ◐ | "왜 살아있나" 사유는 사람만 안다 |
Idle 오래된 Snapshot · AMI | ● | ● | – | ◐ | 백업·규제 보존 정책 확인 필요 |
스토리지 EBS gp2 → gp3 전환 | ● | ● | – | – | in-place 변환 — 안전 |
스토리지 S3 Lifecycle / Intelligent-Tiering | ◐ | ● | ● | ● | 객체 단위 접근 패턴은 사람이 검토 |
스토리지 CloudWatch 로그 보존기간 | ● | ◐ | ◐ | ● | 컴플라이언스/감사 요건 확인 |
컴퓨팅 Generation Upgrade (m5 → m6g) | ● | ● | ◐ | ◐ | arm64 호환성·벤치마크 검증 후 적용 |
컴퓨팅 Right-sizing (CPU·Memory) | ◐ | ● | ● | ◐ | 30일 평균만으론 부족 — 피크/이벤트 보강 |
컴퓨팅 RI / Savings Plans 커버리지 | ● | ● | – | ● | 향후 6~12개월 사용량 전망 협의 |
컴퓨팅 RDS · ElastiCache 미사용 검출 | ● | ◐ | ◐ | ◐ | 연결 클라이언트·서비스 의존 추적 |
네트워크 NAT Gateway → VPC Endpoint | ◐ | ● | ● | ◐ | 트래픽 흐름 재설계 — 보안 정책 영향 |
네트워크 Data Transfer 상위 흐름 | – | ● | ● | ● | 청구서로만 보임 — 아키텍처 재설계 |
네트워크 CloudFront 도입 ROI | – | ● | ◐ | ◐ | Origin 호출 패턴·캐싱 정책 검토 |
가용성 Spot 전환 후보 | ◐ | ● | ● | ● | 중단 내성·재시작 비용·SLA 검증 |
가용성 야간 자동 정지 (개발/스테이징) | ◐ | ● | ◐ | ● | 운영 시간 정책 합의 필요 |
컨테이너 EKS 비용 분배 (Namespace/팀) | – | ◐ | ● | ● | KubeCost·태그 도입 + 책임 분배 |
거버넌스 미관리 계정 · 태그 누락 | ● | ◐ | ◐ | ● | Org/SCP 정책 — 장기 거버넌스 |
* 매트릭스는 진행 중인 초안입니다 — 고객사 환경에 따라 자동/수동 비중은 달라질 수 있으며, 실제 진단 보고서에는 각 항목의 위험도와 롤백 난이도가 함께 표기됩니다.
"이거 끄세요" 를 넘어선 고도화
단가 인하만으로 끝나지 않습니다. 아키텍처 자체를 재설계해 청구서가 다시 부풀어 오르는 것을 방지합니다.
진행 과정과 비용
선결제 · 월 구독 없습니다. 절감이 검증된 다음 달, 검증된 금액의 절반을 한 번만 청구합니다.