하나銀 IT장애, 어바이어-IBM 공방

하나銀 IT장애, 어바이어-IBM 공방

  • 김동기 기자
  • 승인 2011.03.16 17:53
  • 댓글 0
이 기사를 공유합니다

어바이어 장비 결함 vs AIX 대체작동 불능 맞서

지난 1월 26일 발생한 하나은행(은행장 김정태) IT 장애를 놓고 논란이 이어지고 있다.

김정태 행장 지시로 ‘재발 방지’ 매뉴얼을 만들고 있는 하나은행은 스위치 장비를 납품한 어바이어(지사장 양승하)와 유닉스 서버를 공급한 한국IBM(대표 이휘성)을 상대로 대책을 논의 중이다.

장애원인이 상품처리시스템 애플리케이션 서버와 DB서버 중간에 놓인 어바이어(옛 노텔 공급) 스위치에서 발생했고 IBM서버는 페일오버(시스템 대체작동)를 수행하지 못했기 때문이다.

◆1월 26일 장애의 구체적인 원인은 = 하나은행은 코어뱅킹 애플리케이션 서버로 3대의 장비를 배치하고 하나의 장비 이상시 나머지 2대로, 두 대의 장비 이상시 1대로 운영하는 구조다.

각 애플리케이션 서버에 DB서버가 병렬로 이어져 있다.

하나은행의 장애는 어버이어가 인수한 노텔 스위치 장비의 결함으로 운영이 중단되면서 발생했다. 

업계에 따르면 어바이어 스위치 장비는 작동이 중단되면 스위치 장비 스스로 서버 운영체제 통신모듈에 ‘스위치 작동불능’ 메시지를 자동으로 전달하고 다운되는 구조로 되어 있다.

이 메시지를 받은 서버 운영체제는 2호기, 3호기로 페일오버(대체작동) 시키면서 정상적인 분산처리를 수행했을 것이라는 게 어바이어 측 주장이라고 하나은행은 전했다.

즉 상품처리시스템 및 DBMS가 탑재된 한국IBM 유닉스 서버에서 이 메시지를 처리하지 못했다는 게 어바이어측이 하나은행에 주장한 내용이다.

이에 대해 어바이어 측에 공식입장을 요청했으나 답변이 없는 상태다.

IBM “메시지 기록없다” 주장 = 그러나 한국IBM 입장은 다르다. IBM은 스위치가 물리적 결함을 일으키고 다운됐고 메시지를 보냈다는데 로그기록 등 흔적이 없다는 것이다.

시스템 대체작동(페일오버)은 메시지를 받은 후 다음 처리 순서라는 주장이다.

특히 DB서버가 정상적인 처리 과정에 있다가 스위치에서 신호를 받지 못하자 RAC 기능을 가동, 서버 운영을 중단시켰기 때문에 스위치가 메시지만 제대로 전달했다면 서버는 다운되지 않았을 것이라는 게 IBM측 입장이다.

하나은행은 어바이어가 인수한 노텔 장비에 메시지 전송 기능이 있었는지 여부와 한국IBM AIX 운영체제 내 페일오버 기능이 기본 제공됐어야 한다는 점을 내세워 두 회사를 압박하고 있다.

현재 어바이어는 관련 노텔 스위치 장비를 교체했고, 한국IBM은 스위치 작동 불능시 페일오버 기능을 지원하는 AIX 최신 버전으로 업그레이드를 제공한 상태다.

하나은행 관계자는 “노텔 장비의 문제점은 확인했으나 IBM은 책임없다는 점만 주장하고 있다. AIX 업그레이드 버전에 페일오버 기능이 제공된 점을 보면 IBM 주장의 설득력이 떨어진다”고 강조했다.

이 쟁점은 하나은행이 현재 만들고 있는 ‘재발방지’ 대책에서 어바이어나 한국IBM이 재발에 대한 책임을 규정해야 하기 때문에 중요한 논제가 되고 있다.

즉 향후 동일 유시한 장애가 발생할 경우 하나은행은 책임 소재를 명확히 해 책임을 묻겠다는 입장이서 자칫 막대한 패널티를 물릴 수 있기 때문이다.

따라서 이번 하나은행 IT장애 공방전 결과에 따라 어바이어와 한국IBM 어느 한쪽은 만만치 않은 치명상을 입을 수도 있다는 점에서 논란은 이어질 것으로 보인다.

<김동기 기자>kdk@bikorea.net



댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?

댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.