기술블로그

[일반] Python으로 Wanted 서비스의 헬스 체크하기

작성자 정보

  • QARobot 작성
  • 작성일

컨텐츠 정보

  • 875 조회

본문

[기술포스팅 원문]https://chance-doe.tistory.com/9


[기술포스팅 요약]

이번 글은 원티드랩 QA팀의 김명관님이 Python을 이용하여 Wanted 주요 서비스의 안정성을 체크하는 스크립트를 개발하게 된 배경과 운영 방식에 대해 설명한 내용입니다. 주요 서비스의 헬스 체크를 자동화하여 서비스의 안정성을 지속적으로 모니터링하고, 이로 인해 발생하는 장애를 빠르게 감지하고 대응하는 방식을 공유합니다.

img.png 


  • 원티드랩은 데이터독을 통해 서비스와 서버의 상태를 실시간으로 모니터링하며 오토 스케일링을 통해 서버 리소스를 유동적으로 관리하고 있습니다.
  • 그러나 특정 시점에서 비정상적인 트래픽 상승이 발생할 경우 서비스가 불안정해지는 문제가 발생할 수 있습니다.
  • 기존의 데이터독 경고 메시지로는 긴급한 상황을 빠르게 인지하고 대응하기 어렵기 때문에, QA팀에서는 사용자 입장에서 체감할 수 있는 장애성 이슈를 모니터링할 수 있는 도구를 개발했습니다.
  • Python을 이용한 헬스 체크 스크립트는 특정 URL의 HTTP 상태 코드를 검증하며, 비정상 상태가 지속될 경우 QA팀에 알림을 발송합니다.
  • 스크립트는 Jenkins를 통해 1분마다 실행되어 매일 약 10,000건의 모니터링을 수행하고 있습니다.
  • 모니터링 결과는 Google Sheet에 집계되고, Looker Studio를 통해 일간, 주간, 시간대별 에러 발생 통계를 시각화하여 제공합니다.
  • 이 스크립트를 통해 서비스 안정성 모니터링을 자동화하고, QA팀이 신속하게 대응할 수 있는 체계를 마련하게 되었습니다.
  • Python, Jenkins, Looker Studio와 같은 도구를 활용한 이번 프로젝트는 QA 활동의 효율화를 위한 중요한 경험이었습니다.
  • 앞으로도 지속적으로 품질 활동을 개선하고 데이터를 통해 의미 있는 인사이트를 제공하기 위해 노력할 것입니다.

img.png 




이 게시글은 [GPT-4o model]를 통해 요약되었으며, 정보 공유 목적으로 게시되었습니다. 원문 게시물에 대한 책임이나 이해 관계가 없습니다. - 소프트웨어QA 포럼

관련자료

댓글 0
등록된 댓글이 없습니다.