Search

얼럿 매니저(Alert Manager)

복잡한 클라우드 장애 관리, 하나로 통합하고 해결 속도 높이기

장애 알람도 선별이 필요해!

클라우드 서비스 운영 시 장애 알람은 꼭 필요한 기능이지만 너무 많은 알람은 오히려 운영자의 업무를 방해합니다.
뿐만 아니라 Grafana, Prometheus, Amazon SNS 등 여러 개의 모니터링 툴을 매번 체크하는 것도 업무 효율성을 현저히 떨어뜨립니다.
SpaceONE은 모니터링 툴을 하나로 통합하여 체계적으로 장애 알람을 관리하고, 관리 이력을 분석하여 사용자 경험을 개선합니다. “

SpaceONE의 얼럿 매니저란?

얼럿 매니저(Alert Manager)는 SpaceONE의 장애 관리 서비스입니다.
얼럿 매니저 서비스를 통해 모니터링 시스템에서 발생하는 다양한 패턴의 이벤트 혹은 인시던트를 통합 관리할 수 있습니다.
얼럿 매니저만의 특별한 기능은 다음과 같습니다.
웹훅(Webhook)을 통해 수신한 이벤트를 SpaceONE이 체계적으로 정리해 ‘얼럿(Alert)’을 생성합니다.
SpaceONE에 접속하지 않아도 알림(Notifications) 서비스를 통해 얼럿의 생성 유무와 상태 변경을 확인할 수 있습니다.
얼럿 상태를 변경하거나 담당자를 체계적으로 관리할 수 있습니다.
프로젝트 구성원들에게 효과적으로 얼럿을 전달할 수 있습니다.

 얼럿 매니저 대시보드

사용자는 기본 대시보드, 혹은 원하는 위젯을 조합한 커스텀 대시보드를 통해 비용 데이터를 한눈에 볼 수 있습니다.
1.
모든 얼럿 현황을 한 눈에 확인할 수 있습니다.
2.
일별 얼럿 통계를 확인하고, 언제 얼럿이 많이 발생했는지 확인할 수 있습니다.
3.
프로젝트별 얼럿 처리 현황도 한 번에 확인할 수 있습니다.

 원하는 채널로 얼럿 발생을 알려주는 자동 알림 발송 서비스

신속한 대응이 필요한 얼럿이 발생했을 때, 바로 원하는 채널에서 알림을 받을 수 있습니다.
프로젝트의 알림(Notifications) 탭에서 알림 수신 채널을 등록해 보세요. 뿐만 아니라 개인 프로필에서 개인 알림 채널도 등록할 수 있는 장점이 있습니다.

   장애 처리 워크플로 관리

알림을 받은 장애별로 담당자를 설정하고, 단계별 상향식 보고 정책(Escalation Policy)를 통해 장애 알림을 위급성과 처리 상태를 기준으로 분류할 수 있습니다.
각 장애에 대한 처리 이력을 조회하며 장애 처리 워크플로 전반을 관리할 수 있습니다.

   세부 알림 정책 수립 관리

이벤트 규칙을 설정하여 특정 조건에 맞는 알람만 추려낼 수 있을 뿐만 아니라, 유지 관리 기간 설정, 자동 복구 등 다양한 세부 설정을 통해 체계적으로 장애 알람을 관리할 수 있습니다.
 멀티클라우드 관리 플랫폼 SpaceONE 구경가기