IT 기술의 발전으로 인해 단일 국가의 사용자를 대상으로 하는 서비스들이 글로벌 사용자를대상으로 점차 확대되어 가고 있다. 서비스의 규모가 확장되어 기존 시스템 환경에서는 많은 사용자들의 트래픽을 감당하기 어려운 추세이다. 따라서 기존 IT 환경의 확대가 필요함에 따라 기존의 분산 컴퓨팅 서비스를 클라우드 컴퓨팅 서비스로 전환하는 연구들이 진행되고 있다. 클라우드 컴퓨팅 서비스가 사용자에게 지속적으로 안정된 서비스를 제공하기 위해서는 시스템 장애가 발생하더라도 장애극복을 통한 고가용성을 보장하는 것이 필요하다. 대부분의 기존 연구에서는 클라이언트 서버, 애플리케이션 서버, 데이터베이스 서버 등 다계층 분산시스템의 개별 구성요소에 대한 장애극복 연구는 많이 진행된 반면 상대적으로 시스템 전반에 대한 가용성 연구는 부족한 편이다. 따라서 본 연구는 AWS 클라우드가 제공하는 부하분산 코디네이션 서비스를 활용하여, 분산 서버의 계층별 클러스터링과 모니터링 서버 및 오토스케일링을 적용한 장애극복 메커니즘을 제안한다. 또한 발생 가능한 장애 시나리오에 따른 서비스 작동 여부를 확인하여 본 논문에서 제안한 클라우드 기반 장애극복 시스템을 검증하였다.