기술블로그

[네이버] 서비스 장애를 예방하는 방법: Chaos Engineering

작성자 정보

  • QARobot 작성
  • 작성일

컨텐츠 정보

  • 722 조회

본문

[기술포스팅 원문] https://d2.naver.com/helloworld/0403593




[기술포스팅 영상 요약]

NAVER ENGINEERING DAY 2024에서 발표된 세션 내용을 공유합니다. 이 발표에서는 네이버 뉴스 서비스에서 장애를 예방하고 신뢰성을 높이기 위해 신입 개발자가 Chaos Engineering을 적용한 경험을 중심으로 이야기가 진행되었습니다. 주요 내용은 아래와 같습니다.

  • Chaos Engineering의 개념과 이를 통해 시스템의 신뢰성을 높이는 방법을 소개합니다.
  • Netflix가 IDC 장애 이후 클라우드로 전환하면서 도입한 Chaos Monkey와 같은 도구들을 활용한 사례를 설명합니다.
  • Toxiproxy를 테스트 도구로 선택한 이유와 구조, 이를 활용한 proxy server 구성 방법을 설명합니다.
  • 뉴스서비스의 잠재적인 Single-Point-of-Failure(SPOF)를 식별하고, 이를 예방하기 위해 Toxiproxy를 사용하여 테스트 환경을 구성한 경험을 공유합니다.
  • Chaos Engineering을 적용하여 뉴스서비스의 구조를 분석하고, 가설을 세워 실제 테스트를 수행한 결과와 그 과정에서 발견된 코드의 문제점 및 개선 사항을 설명합니다.




"이 게시글은 [GPT-4o model]를 통해 요약되었으며, 정보 공유 목적으로 게시되었습니다. 원문 게시물에 대한 책임이나 이해 관계가 없습니다. - 소프트웨어QA 포럼"

관련자료

댓글 0
등록된 댓글이 없습니다.