2026-03-12 · 박서연

배포 파이프라인에서 롤백 리허설을 고정하는 법

배포 파이프라인에서 롤백 리허설을 고정하는 법

배포 · Argo · 운영

롤백은 버튼 한 번의 문제가 아니라 데이터·모델·구성의 정합을 동시에 맞추는 행위입니다. 먼저 헬스 프로브와 비즈니스 KPI를 분리해 기록하고, 승격 단계마다 담당자와 연락망을 고정합니다.

리허설 보드에는 마지막으로 성공한 배포 태그, 데이터 스냅샷 버전, 그리고 알람 라우팅 그룹을 적습니다. 장애 주간 리뷰에서 이 보드를 읽는 순서를 팀 합의로 정하면 회의 시간이 줄어듭니다.

코어오토랩 부트캠프에서는 Argo Rollouts 예시를 기반으로 이 보드를 채우는 과제를 제공합니다. 실제 고객 데이터는 사용하지 않으며, 합성 트래픽으로 지표를 흔들어 봅니다.

마지막으로, 리허설이 끝나면 실패한 가정을 문서에 남겨 다음 스프린트의 자동화 백로그로 넘깁니다. 이렇게 하면 같은 유형의 장애가 반복될 때 설명 가능한 기록이 남습니다.