스마트폰을 통해 수시로 웹에 접근할 수 있는 환경이 갖추어진 이래 가장 수익성이 높은 사업은 대부분 인터넷 상에서 이루어지고 있습니다. 따라서 IT 서비스의 운영을 효율적으로 관리할 수 있는 KPI를 설정해 측정 및 관리를 하는 것이 매우 중요합니다.
IT 인프라 운영 비용/효율 관련 KPI
IT 서비스를 운영하는데 있어서 가장 중요한 부분 중 하나는 비용입니다. 아래는 IT 서비스 운영에서 활용될 수 있는 대표적인 KPI를 소개합니다.
- 총소유비용(TCO) : (하드웨어 + 소프트웨어 + 유지 관리 + 인력 + 유틸리티) / 유효 수명
- 인프라 투자수익률(ROI) : (인프라 혜택 - 인프라 비용) / 인프라 비용
- 사용자당 비용: 총 IT 비용 / 사용자 수
- 사용자당 인프라 비용: 총 인프라 비용 / 사용자 수
- 수익 대비 IT 지출 비율: 총 IT 비용 / 총 수익
- 서버 활용: 총 CPU 사용 시간 / 총 CPU 시간
- 스토리지 활용도: 사용된 총 스토리지 / 총 스토리지 용량
- 네트워크 활용: 사용된 총 네트워크 대역폭 / 총 네트워크 대역폭
- PUE(전력 사용 효율성): 총 시설 전력 / IT 장비 전력
- 데이터 센터 공간 활용: 사용된 총 공간 / 총 데이터 센터 공간
- 사용자당 에너지 비용: 총 에너지 비용 / 사용자 수
- 사고당 비용: 총 사고 비용 / 총 사고 횟수
- IT 인건비: IT 서비스, 인프라 관리에 들어간 인건비
IT 인프라 운영 품질 관련 KPI
IT 서비스의 운영은 크게 두 가지 부분으로 나누어 볼 수 있습니다. 인프라의 운영과 서비스의 운영입니다. 실제로 두 부분은 겹치는 부분이 많지만 이해를 돕기 위해 인프라 자체와 서비스의 부분으로 나누어 소개합니다.
- 장애 발생 건수: 기간 단위별 장애 발생 건수를 계산합니다
- 사용 가능 비율: (사용 시간 / 전체 시간) x 100
- 평균 회복 시간(MTTR) : 전체 다운타임 / 장애 횟수 (소프트웨어에 문제가 발생했을 때 해결까지 걸리는 평균 시간을 측정)
- 평균 장애 인지 시간(MTTD): 시스템 상의 오작동을 찾는데 걸리는 평균 시간을 측정
- 평균 고장 간격 (MTBF): 전체 사용 시간 / 장애 횟수
- 실제 보안 사고 횟수: 시스템에서 무단 접근, 공개, 사용 수정 또는 정보 파괴가 일어난 횟수. 소프트웨어의 보안 범위를 설정하고 잠재적인 완화 조치를 제공하는데 도움이 되는 지표입니다.
- 사건 해결 시간: 사건 해결 시간 / 사건 수
- 변경 성공율: 성공한 변경 횟수 / 전체 변경 횟수
- 변경 실패율: 실패한 변경 횟수 / 전체 변경 횟수
- 네트워크 사용 시간: (네트워크 사용 가능성 / 전체 시간) x 100
- 서버 사용 시간: (서버 사용 가능성 / 전체 시간) x 100
- 애플리케이션 사용 시간: (애플리케이션 사용 가능성 / 전체 시간) x 100
- 백업 성공률: (백업 성공 횟수 / 전체 백업 횟수) x 100
- 복구 성공률: (복구 성공 횟수 / 전체 복구 횟수) x 100
- 업그레이드 성공률: (업그레이드 성공 횟수 / 전체 업그레이드 횟수) x 100
- 기능과 설계 품질율: [1 - (∑기능 및 설계 이슈) / (∑모든이슈)] x 100
IT 서비스 운영 품질 관련 KPI
서비스 운영의 품질은 제공하는 서비스에 따라서 매우 다양한 KPI를 설정할 수 있습니다. 아래 KPI를 참조해서 자사의 서비스에 맞는 KPI를 설정해 보길 권장합니다.
- 사용자 만족도: (사용자의 충족도 점수 / 최고 점수) x 100
- 서비스 이용율: (사용자의 서비스 이용 횟수 / 전체 사용자 수) x 100
- 사용자 지원 처리 시간 (Time to resolve user support incidents): 지원 요청에서 처리 완료까지 걸린 평균 시간
- 사용자 지원 발생 빈도 (Frequency of user support incidents): 총 지원 요청 수 ÷ 총 운영 시간
- 응답 시간: 요청이 서버로 전송된 시점과 서버에서 마지막 바이트가 수신되는 데 걸리는 시간 측정
- 사용 편의성 및 사용자 경험 측정항목: 소프트웨어가 고객의 기대를 충족하는지 판단하기 위한 지표들
- NPS(순수추천지수): 제품이나 서비스를 다른 사람에게 추천하려는 고객의 수를 파악
- 고객만족도 점수(CSAT): 제품을 경험한 고객에게 설문조사를 통해서 조사
- 고객 노력 점수(CES): 고객이 서비스나 제품을 이용할 때 얼마나 쉽거나 어려웠는지를 조사
- IT문의사항 처리율: (IT 문의 해결 건수 ÷ IT 문의 요청 건수) x 100
- 평균 처리 시간: 처리 시간 / 처리된 요청 수
- 사용자 지원 요청 비율: 사용자 지원 요청 횟수 / 전체 사용자 수 x 100
- FCR(첫 통화 해결률): 첫 번째 통화만으로 해결한 비율 해결률
- 재사용성 (Reusability): 서비스 재사용 비율
- 평균 처리 속도 : 총 요청 처리 속도/ 요청 횟수
IT 운영 KPI 설정 시 주의할 점
품질, 기능, 일정이라는 핵심 가치에 부합한다
좋은 KPI는 IT 서비스에서 목표로 하고 있는 기능, 품질을 지키는데 도움이 되는 지표들입니다. 따라서 개별 KPI가 목표에 부합하는지 확인이 필요합니다.
효과나 성과로 이어져야 한다
KPI는 프로젝트가 목표로 하고 있는 일정, 기능, 품질의 상태를 실질적으로 보여주는 지표여야 합니다. 만약 KPI를 개선했는데도 효과나 성과로 이어지지 않는다면 그 KPI는 실질적인 의미가 없습니다.
밸런스를 갖추어야 한다
KPI의 관점이 한쪽으로 기울어질 경우 프로젝트가 잘못된 방향으로 진행될 위험이 있습니다. 따라서 다양한 관점이 반영되어야 하고 필요한 요소를 빠짐없이 포함하고 있는 것이 중요합니다.
책임 소재가 분명해야 한다
KPI를 관리할 책임이 누구에게 있는지 분명하지 않은 경우 실패할 가능성이 매우 높습니다. 책임 소재를 분명히 해서 실질적인 운용을 목표로 하는 것이 중요합니다.
SMART를 의식해서 KPI 작성한다
KPI를 설정할 때 아래의 SMART를 의식하면 도움이 됩니다.
명확하고 측청 가능하고 관련성이 높고 기한이 있는 지표가 좋습니다. 또한 KPI의 목표가 달성 가능할 때 직원들의 의욕을 높일 수 있습니다.
Specific(명확성)
Measurable(측정 가능)
Achievable(달성 가능)
Related(관련성)
Time-bounded(기한 설정)
KPI의 수를 가능한 줄인다
측정해야 할 KPI가 너무 넒으면 그것만으로 업무량이 늘어나게 됩니다. KPI의 측정과 관리에는 최소한의 노력만 투자할 수 있도록 가장 핵심적인 지표들로 한정해야 합니다.
측정 결과가 실질적인 개선으로 이어져야 한다
측정 결과를 통해서 어떤 점이 부족한지를 파악할 수 있어야 하고 실질적으로 개선을 하기 위한 액션으로 이어질 수 있어야 합니다.
만약 KPI를 측정했지만 그것이 행동으로 옮겨지기 어려운 KPI라면 조정이 필요하다는 의미입니다. 소프트웨어 프로젝트의 핵심 목표인 일정, 품질, 기능을 향상할 수 있는 행동으로 이어질 수 있는 KPI를 선정하는 것이 중요합니다.
이상으로 소프트웨어 개발 프로젝트에서 활용할 수 있는 KPI와 주요 포인트에 대해서 살펴보았습니다. 큰 팀이 목표로 하고 있는 소프트웨어의 기능과 품질 그리고 일정을 지키기 위해서는 KPI를 설정하는 것이 중요합니다.
하지만 KPI가 현장을 제대로 반영하지 못할 경우는 측정을 위한 측정으로 전략해서 개발자들의 업무 부담만 높일 수 있습니다.
또한 소프트웨어 개발 작업은 창의적인 작업입니다. 뛰어난 프로그래머일수록 자신들을 충분히 신뢰하고 권한을 맡겨줄 때 더 큰 능력을 발휘하는 경우가 많습니다. 따라서 KPI를 설정할 때는 개발자들과 충분히 의견을 교환해서 KPI에 대한 이해를 공유하는 것이 중요합니다.
함께 보면 좋은 글