1회 : 비즈니스 스마트 네트워킹 위한 APM
상태바
1회 : 비즈니스 스마트 네트워킹 위한 APM
  • 데이터넷
  • 승인 2007.10.05 00:00
  • 댓글 0
이 기사를 공유합니다

L4++/L7++ 스위칭 환경으로 변화하는 비즈니스 스마트 네트워킹
비즈니스 스마트 네트워킹으로 서비스 안정성 ‘보장’

기업 인프라 모든 요소 성능 파악 … 정확한 모니터링으로 장애 발생률 최소화

IT 담당자는 복잡한 인프라 환경에서 비즈니스와 관련된 애플리케이션 지연 현상을 효율적으로 파악해야 할 뿐 아니라 고객, 비즈니스 파트너 그리고 사내 비즈니스 관련 요소를 빠르게 제공해야 한다. 그러나 복잡하고 분산된 환경에서 성능 하락의 정확한 원인을 파악하지 못한 채 시도하는 부정확한 개선은 비즈니스의 소중한 시간과 기업의 자원을 낭비할 수 있다. 이에 3회에 걸쳐 L4++/L7++ 스위칭 환경으로 변화하는 비즈니스 스마트 네트워킹에 대해 살펴본다. <편집자>

연재순서
1회 : 비즈니스 스마트 네트워킹 위한 APM (이번호)
2회 : 유무선 통합 환경에서 L4++/L7++ 스위칭 필요성①
3회 : 유무선 통합 환경에서 L4++/L7++ 스위칭 필요성②

이진원 //
라드웨어코리아 과장
jasonl@radware.co.kr

2000년 대 이후 기업 네트워크 구축의 가장 중요한 목적은 다른 위치의 인프라 환경에서 애플리케이션 서버에 대중이 간편하고 좀 더 빠르게 접속하게 하는 것이었다. 이러한 목적에 부합하기 위해 인프라 환경에는 다양하고 정교해진 애플리케이션이 도입됐고, 자연스레 모든 IT 담당자는 복잡한 인프라 환경에서 비즈니스와 관련된 애플리케이션 지연 현상을 효율적으로 파악해야 할 뿐 아니라 고객, 비즈니스 파트너 그리고 사내 비즈니스 관련 요소를 빠르게 제공해야 한다.
그러나 복잡하고 분산된 환경에서 성능 하락의 정확한 원인을 파악하지 못한 채 시도하는 부정확한 개선은 비즈니스의 소중한 시간과 기업의 자원을 낭비할 수 있다. 애플리케이션 성능에 대해 자세히 파악하고, 정확하게 성능 하락 원인을 추적하기란 쉽지 않기 때문이다. 이번 호에서는 웹 애플리케이션 스위치에서 제공하는 애플리케이션 성능 모니터링 기능을 이용해 애플리케이션 성능 파악과 성능 하락 원인 추적 방법에 대해 알아보자.

애플리케이션 성능 모니터링의 필요성
기업 IT 인프라 담당자는 해당 인프라에 접속하는 기업 고객, 사무용 서비스 접속자 등 모든 사용자가 몸소 느끼는 서비스에 항상 민감하게 반응한다. 만약 사용자들로부터 담당하고 있는 서비스에 접속이 느리다 또는 접속인 안 된다는 통보를 받게 되면, IT 담당자는 문제 원인을 파악하기 위해 구축된 인프라에서 그 서비스와 관련된 모든 요소들을 파악해야 한다.
여기에 해당되는 요소는 TCP/IP의 물리적 계층에 해당되는 케이블 불량에서부터 네트워크 장비 및 애플리케이션 계층의 웹 서버, WAS 서버 및 DB 서버 등 모든 관련 요소가 포함된다. 사실 트러블슈팅이라는 관점에서 어디가 문제인지 빨리 파악하는 것은 그 만큼 빨리 문제를 해결 할 수 있다는 의미며, 그 만큼 시간이 절약되고, 트러블슈팅의 가장 중요한 배경이 된다.
이러한 요구를 만족하기 위해 현재는 네트워크 성능 측정 툴을 사용해 네트워크 전체의 지연 시간을 파악하거나 네트워크 관련 요소 각각에 L2, L3 장비 구간을 일일이 파악하고 있다. 또한 구간별 모니터링을 위해 네트워크 장비와 서버에 별도의 성능 측정 소프트웨어를 설치해 구성해야 한다. 이러한 구축에도 불구하고 실제 서비스의 응답속도와 각각의 구간별 응답 체크 및 지연 구간확인을 실시간으로 파악한다는 것은 한계가 있다.
애플리케이션 성능 모니터링은 고객의 애플리케이션 전송과 보안 솔루션에 대해 미리 파악함은 물론 엔드 투 엔드 구간별 성능 측정, 애플리케이션 전송 경로에서 발생되는 병목 구간 위치를 정확히 확인할 수 있으며, 네트워크와 애플리케이션 단계까지 확대되는 기술로 발전됐다. 애플리케이션 성능 모니터링 환경에서 실시간 사용자 트래픽 응답시간과 트랜잭션 실패율을 한 화면으로 나타내 분석할 수 있다. 또한 특정 임계치를 설정해 담당자가 설정한 경계 기준 이상에 도달 했을 때 알려주는 자동 알람 기능은 SLA(Service Level Agreement)의 장애를 실시간으로 검출하고 주요 원인을 차단 할 수 있다.
이러한 애플리케이션 성능 모니터링 환경은 운영중 피해를 최소로 완화할 수 있으며, 신속한 대처로 기업 고객 및 사내 사용자에게 안정된 서비스를 제공 할 수 있다. <그림 1>은 애플리케이션 스위치 장비를 구축해 서버의 부하를 줄이기 위해 로드밸런싱을 구현하고, 웹 애플리케이션 가속기의 TCP 멀티플렉싱, SSL 오프로딩, 캐싱, 이미지 압축, 웹 압축, TCP 옵티마이제이션 기능을 사용해 애플리케이션 최적화를 구성한 일반적인 기업 인프라 환경이다.

애플리케이션 성능 모니터링의 동작 방법
앞서 언급한 바와 같이 현재 기업들은 인터넷 환경 하에서 보안 침해와 트래픽 증가를 해결하기 위해 다양한 네트워크 장비를 활용하고 있다. 또한 과거보다 정교해진 애플리케이션 서버를 도입해 사용자에게 좀 더 빠르고 안전한 서비스를 제공하고 있다. 만약 어느 사용자가 기업 홈페이지에 접속해 인증 절차를 거처 특정 서비스에 접속한다고 가정하면, 사용자는 단순히 홈페이지에 사용자 계정과 자신의 패스워드를 넣은 것으로 서비스에 접속하게 되지만 인프라 환경에서는 네트워크 장비는 물론 빠른 서비스 제공을 위해 구축된 다양한 서버를 거치게 된다.
이는 사용자가 해당 홈 페이지에 접속하면 먼저 웹 서버에서 사용자에게 응답을 주게 되며, 그 사용자가 특정 애플리케이션에 접속하려 시도한다면 웹 서버는 애플리케이션 서버와 통신한 후 사용자에게 응답을 준다. 만약 사용자 고유 정보를 전달해야 할 서비스라면 웹 서버와 DB 서버와의 원활한 통신이 이뤄져야만 사용자에게 빠르고 정확한 서비스를 보여줄 수 있다. 단순히 웹 서버를 통해 모든 서비스가 제공되는 환경이 아니라 다양한 서버들이 서로 연동을 통해 사용자에게 정교하고, 빠른 서비스를 제공하게 된다.
이러한 인프라 환경에서 애플리케이션 성능 모니터링 툴을 이용해 크게 두 가지 측면으로 나눠 사용자 서비스 성능을 측정할 수 있다. 그 중 하나는 기업 비즈니스 인프라 환경에 구축된 네트워크 장비인 IPS, 애플리케이션 스위치 사이의 통신 구간의 응답속도 측정 방법이다. 각 장비의 구간별 응답속도를 주기적인 모니터링을 통해 실시간으로 보여줘 담당자는 병목 현상 및 네트워크 장비간 구간별 상황을 빠르게 파악 할 수 있다.
그러나 실제 네트워크 환경에는 문제가 없더라도 특정 서버에서 동작중인 애플리케이션 오류로 인해 서비스 지연과 장애가 발생할 소지가 있다. 따라서 서비스 제공에 포함된 모든 서버의 애플리케이션 상태를 확인할 수 있어야 한다. 즉, SLA의 모니터링 기법이 필요하다. 애플리케이션 성능 측정 기법을 사용하면 기존에 설정된 애플리케이션 스위치에서 모든 서버의 응답속도 및 SLA까지 주기적으로 확인할 수 있다. <그림 2>는 인프라 환경에 설정된 네트워크 장비 구간별 응답속도와 웹 애플리케이션 스위치를 이용해 다양한 서버의 애플리케이션 응답속도를 측정해 APM(Application Performance Monitoring)에 설치된 PC로 전달하는 과정이다.

APM 이용한 애플리케이션 실시간 모니터링
APM은 특정 병목 구간을 파악하고 실시간으로 기록하기 위해 물리적으로 구성된 전송 경로 중 멀티 포인트 측정 방법을 이용한다. 이러한 방법은 특정 애플리케이션(오라클, SAP, ERP)의 지연 원인을 정확히 파악할 수 있으며, 내·외부 사용자가 해당 서비스 접속 시 겪게 되는 장애가 어떤 서버의 성능 저하로 발생됐는지 확인할 수 있다.
<그림 3>은 APM에서 웹 서버, 애플리케이션 서버 그리고 DB 서버의 응답시간을 실시간으로 보여주는 화면이다. 만약 DB 서버 애플리케이션 상 이슈가 발생된다면 정상적인 응답시간보다 현저히 느리게 관측될 것이다. 관리자는 이 한 화면으로 인프라에 구축된 모든 서버 상 애플리케이션을 한눈에 확인할 수 있다.
이러한 모니터링 방식을 통해 담당자는 특정 경로 및 전체 경고에 대한 HTTP 프로토콜 응답시간 확인은 물론 웹 서버와 DB 서버, 애플리케이션 서버의 응답시간을 실시간으로 확인 가능하다. 또한 APM이 설치된 모니터링 PC 기준으로 클라이언트와 서버에서 애플리케이션별 응답시간을 실시간으로 보여주는 기능은 서비스 장애 시 어느 구간 문제인지를 빠르게 파악할 수 있다.
<그림 4>는 애플리케이션 HTTP, HTTPS 별 응답시간을 클라이언트 단과 서버 단에서 실시간 측정하는 화면이다. 관리자는 이 화면만으로 네트워크 경로 문제로 인한 장애인지 서버 애플리케이션 장애인지 바로 파악할 수 있다. 만약 클라이언트 단 응답속도가 서버 단 응답속도보다 현저히 느려진다면, 클라이언트가 접속하기 위한 경로 이상유무만 파악하면 되며, 그 반대인 경우에는 느려지는 해당 서버의 애플리케이션만 확인하면 된다.

APM의 주요 기능과 장점
APM은 전송 경로 중 여러 위치에서 트래픽 및 애플리케이션을 실제 파악하기 위해 클라이언트, 서버 단 애플리케이션, 풀 SSL 핸드쉐이크 응답시간을 측정할 수 있으며, 인프라환경의 대역폭과 애플리케이션 스위치를 통해 들어오는 트랜잭션을 실시간으로 파악할 수 있다. 또한 애플리케이션에서 발생될 수 있는 트랜잭션 실패율과 풀 SSL 핸드쉐이크, 애플리케이션 리소스의 불완전 비율을 미리 파악, 문제 발생 소지가 있는 애플리케이션을 사전에 파악해 장애 발생률을 최소한으로 낮출 수 있으며, 임의로 생성한 트랜잭션이 아닌 실제 사용자 트래픽을 측정해 설치에 관련된 오버헤드가 필요하지 않고, 정확한 모니터링 측정값을 기대 할 수 있다.

모니터링 기법은 ‘진화중’
과거 네트워크 장비 자체가 중요한 요소가 돼 인프라가 확장됐고, 그 이후 구축된 네트워크를 통해 흐르는 애플리케이션을 좀 더 정교하게 하기 위한 다양한 애플리케이션 서버가 구축 됐다. 지금은 구축된 네트워크와 애플리케이션을 이용한 기업 비즈니스 이윤을 극대화 할 목적으로 인프라가 활용되고 있다. 이러한 관점에서 보면 보다 정교해지고 복잡해진 인프라 환경에 포함된 모든 요소의 성능을 파악하는 것은 어쩌면 당연한 흐름이며, 실시간 모니터링과 사전 이상 징후 파악을 통해 안정적인 서비스를 제공하는 것이 IT 관리자의 궁극적인 목적이며 임무일 것이다.
여러 데이터센터와 복잡한 왠, 방화벽, 웹 애플리케이션 스위치, IPS 등과 같은 보안 장비 그리고 멀티 서버 팜 그리고 데이터베이스를 포함한 모든 요소를 파악하기 위해서는 시대의 흐름에 맞춰 모니터링 기법도 더욱 더 진화할 전망이다. 다음 호에서는 ‘유무선 통한 환경에서의 L4++/L7++ 스위칭’에 대해 알아보도록 한다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.