[올리브영] 올리브영 QA의 AWS Lambda를 통한 On call 도입기
작성자 정보
- QARobot 작성
- 작성일
컨텐츠 정보
- 906 조회
본문
[기술포스팅 원문] https://oliveyoung.tech/blog/2024-05-20/oliveyoung-qa-oncall/
[기술포스팅 요약]
안녕하세요, 올리브영 QA Engineer 멜짱입니다. 이번 포스팅에서는 AWS Lambda와 Jira Automation을 이용해 On-call 시스템을 도입한 과정을 공유하고자 합니다. 기존에는 슬랙을 통해서만 인시던트를 관리했지만, 이는 알림이 잘 전달되지 않는 문제점이 있었습니다. 이를 해결하기 위해 AWS Lambda를 활용해 On-call 시스템을 구축하였습니다.

AWS Lambda는 서버리스 컴퓨팅 서비스로, 코드 실행을 위한 서버 관리를 필요로 하지 않으며, 특정 이벤트에 응답하는 트리거를 설정할 수 있는 장점이 있습니다. 이번 도입 과정에서는 다음과 같은 작업들이 수행되었습니다:
- 슬랙봇을 통해 인시던트를 생성하고, Lambda 함수로 슬랙 채널을 자동 생성
- 비동기 작업을 통해 채널 생성 및 유저 초대를 자동화
- CloudWatch Logs를 트리거로 활용하여 Jira 티켓 자동 생성
- 온콜 웹 훅을 호출해 관련 팀에 장애 알림 전송
- 확장성: 함수를 추가하거나 업데이트하여 시스템 변화에 빠르게 대응 가능
- 비용 절감: 실제 코드 실행 시에만 비용이 청구됨
- 유연성: 다양한 이벤트 소스와 통합되어 다양한 시나리오에 적용 가능
- Jira와의 연동 문제: 사내망에서만 접속 가능한 Jira를 Lambda와 연동하기 위해 특정 대역만 방화벽 허용
- 코드 길어짐으로 인한 확장성 저하: 함수를 분리하여 코드의 가독성과 유지보수성 향상
On-call 시스템 도입으로 인해 장애 발생 시 더 빠르게 대응할 수 있게 되었고, 인시던트 발생 시 즉시 Jira 티켓이 생성되어 관리 효율성이 높아졌습니다. 온콜 시스템 도입으로 장애 대응 속도와 체계가 향상되었습니다.
"이 게시글은 [GPT-4 모델]를 통해 요약되었으며, 정보 공유 목적으로 게시되었습니다. 원문 게시물에 대한 책임이나 이해 관계가 없습니다. - 소프트웨어QA 포럼"
관련자료
-
이전
-
다음
댓글 0개
등록된 댓글이 없습니다.