일관된 평가를 돕는 ‘등급 가이드’ 작성 방법과 예시

등급 가이드 작성 요령

성과평가에서 등급을 나누고 있나요? 내가 받은 ‘B등급’의 의미가 무엇인지 알기 어려워 당황하지는 않았나요? 평가 등급이란 구성원 개인의 성과 또는 성취 수준을 나타내는 척도를 의미합니다. 일반적으로 S-A-B-C-D, 5-4-3-2-1 등 수치형 혹은 “기대를 충족함” “기대를 초과함” 등 서술형 등급이 활용되지요. 이러한 등급은 정량적 평가 결과를 제공하여 구성원 성과 간의 차이를 식별하는 데 도움이 됩니다.(링크) 이러한 차이를 앎으로써 구성원들은 자신의 역할과 기여를 보다 정확히 인식할 수 있고요.(링크)

평가자에게도 등급은 각 역할에 부여된 기대사항을 이해하고 이를 토대로 공정하고 일관된 평가를 내릴 수 있는 지침으로서 기능합니다. 성과의 기준을 먼저 정의하고, 이 기준에 동의한 뒤 평가를 하면 고정관념에 사로잡힐 가능성과 편향이 줄어든다는 연구 결과(링크)도 있습니다.

이러한 필요와 효용에 따라 레몬베이스는 평가 등급의 명칭과 척도를 설정하고 직책, 직군 등 평가 대상자의 속성에 따라 평가 기준을 상술한 ‘등급 가이드’를 전달할 수 있는 등급 체계 기능을 제공합니다.

등급 체계 관리의 5단계

각 평가 등급의 의미를 명확히 이해하고 모든 평가 대상자에게 일관된 기준을 적용하기 위해서는 등급 체계를 미리 설계하고, 이를 투명하게 공유하는 것이 전제되어야 합니다. 이렇게 등급 체계를 효과적으로 관리하기 위해 (1) 등급의 활용 목적 이해 (2) 유형 및 범위 선택 (3) 사전 테스트 (4) 교육 (5) 피드백 청취 및 개선 등 5단계를 거치기를 권합니다.

1. 평가의 목적에 따라 등급을 구분할지 결정한다

평가 결과를 어떤 인사 결정에 활용할 것인지, 평가의 목적이 무엇인지에 따라 등급을 나눠야 하는 이유를 이해할 수 있습니다. 예컨대 급여 인상, 보너스 지급 등 보상에 관한 의사결정 과정의 일부로 성과평가를 진행할 때는 등급 구분이 유용합니다.

평가 등급을 나누는 것의 가장 큰 장점 중 하나는 비교가 용이해진다는 점입니다. 등급 차이를 가르는 기준을 중심으로 뛰어난 성과를 거두는 구성원과 개선이 필요한 구성원을 구분할 수 있고, 시간의 흐름에 따라 구성원 각자의 성장을 추적할 수도 있습니다. 같은 비교선상에서 논의가 가능하기 때문에 각각의 등급에 같은 성과 기준을 적용했는지를 살펴보고 등급을 보정하는 캘리브레이션 과정에서도 데이터에 기반한 판단이 가능해집니다.

🏕️
캘리브레이션에 대한 보다 상세한 내용이 궁금하다면, 아래의 아티클을 함께 읽어보세요.

- 캘리브레이션 미팅 가이드
- 절대평가에서 캘리브레이션이 특히 중요한 이유

2. 평가 등급의 유형과 범위를 선택한다

주로 활용되는 평가 등급의 유형은 수치형, 서술형으로 나눌 수 있습니다. 다만 숫자, 알파벳 등으로 구성된 수치형 등급을 활용하더라도 각 등급의 의미를 이해할 수 있도록 설명을 덧붙일 필요가 있습니다. 각 등급을 부여할 수 있는 평가 대상자에게 기대되는 행동과 영향의 범위 등을 구체적으로 제시하는 것입니다. 아래 표의 내용 중 S등급(최고등급)의 예를 살펴보면, ‘다른 사람들에게 영감을 줄 수 있는 행동을 보인다’라든지, ‘전사적으로 큰 임팩트를 내는 성과’와 같은 설명이 이에 해당합니다.

대부분의 조직은 5점 척도로 구성원의 성과 수준 차이를 측정하고 있습니다.(링크) 5점 만점으로 해석할 수 있는 척도의 단순함과 평가 등급의 긍・부정이 균형을 이룬다는 점 등이 5점 척도의 장점으로 꼽힙니다. 물론 조직의 상황에 따라 다른 척도를 선택할 수 있습니다. 예를 들어, 높은 조직 목표를 추구하고 개인 성과의 임팩트가 큰 IT 플랫폼 기업의 경우 S등급 상위에 SS등급을 추가하기도 하는데요. 절대평가에서 SS등급 기준을 예로 들자면, ‘한 사람의 성과가 전사 전략적 성과를 좌우, 비즈니스 및 기술에 대한 재정의, 일반적인 성과 대비 10배 이상의 성과’ 등으로 정의됩니다.

레몬베이스가 제시하는 '평가 등급 체계의 예시'

3. 평가를 시행하기 전 테스트를 거쳐 개선의 여지가 있는지 검토한다

전사적으로 평가를 시행하기 전, 제도에 대한 이해도가 상대적으로 높은 일부 부서를 대상으로 사전 테스트를 진행해보면 좋습니다. 예를 들어, 평가 등급 개편을 주도한 인사팀이라든지, 평가 등급 개편이 필요하다는 목소리를 낸 특정 부서 등을 대상으로 할 수 있겠지요. 테스트를 통해 각 등급의 의미가 의도대로 전달되고 있는지, 적용에 어려움을 겪지 않는지 ‘실사용자’의 관점에서 개선점을 찾아봅니다.

4. 평가 등급을 사용하는 모든 구성원들이 기준을 이해하고 올바르게 적용할 수 있도록 교육한다

평가 등급을 미리 정하고 이를 참고하면서 평가하도록 하는 이유는 평가 과정에서 일관성과 객관성을 유지하기 위함입니다. 등급의 의미를 제각각 해석할 여지를 최대한 줄이기 위해서 등급의 차이를 가르는 역량, 기술, 행동의 예시를 들어 설명하면 효과적인 교육이 이뤄질 수 있는데요. 레몬베이스 리뷰 제품 내의 ‘등급 가이드’를 구성원의 속성에 맞춰 전달함으로써 이런 교육의 효과를 기대할 수 있습니다.

5. 평가 후, 등급에 대해서도 피드백을 수집하고 이를 기반으로 모니터링하며 개선한다

평가 후 절차에 대한 피드백을 수집할 때, 등급 자체와 등급 가이드에 대한 문항을 포함합니다. 예를 들어, ‘등급의 의미에 따라 안전하게 B등급만 선택하게 된다’든지, ‘가장 낮은 등급을 부여해야 하는 비율이 할당되어 있더라도 인사상 불이익이 있을 경우 이를 선택하는 것이 쉽지 않다’ 등의 피드백이 접수된다면, 척도를 바꾼다든지 최하 등급의 할당은 강제하지 않는 등의 후속 조치를 취할 수 있겠지요.

한번 정한 등급을 바꾸는 것은 어려운 일인 것은 분명하나, 그렇다고 못할 일은 또 아니기 때문에 피드백에 따라 유연하게 접근하며 개선해 나가는 것이 중요합니다. 평가 등급을 개편한 대표적인 사례로 구글을 꼽을 수 있습니다. 구글은 평가자가 등급의 미세한 차이를 구분하기 어렵다는 이유로 2013년 41개 등급을 5개 등급으로 간소화했고, 성과와 영향력을 강조하는 관점을 전사적으로 공유하는 방편의 하나로 평가 등급의 정의에서 ‘임팩트(impact)’란 단어를 전면에 내세웠습니다.

레몬베이스 등급 체계 관리 기능은 크게 (1)등급 설정과 (2)등급 가이드로 나뉩니다. (1)등급 설정 화면에서 평가 등급의 명칭과 설명을 입력한 뒤 (2)등급 가이드는 각 속성별로 평가 기준을 작성, 공유하게 됩니다. 등급 가이드는 필요한 경우에만 선택적으로 작성, 활용할 수 있습니다.

‘등급 가이드’의 구성 요소 및 작성시 유의사항

역할에 따른 명확한 평가 기준 제시

평가 기준을 일관되게 적용한다는 것이 조직 전체에 일률적인 평가 기준을 적용하는 것을 의미하지는 않습니다. 이는 오히려 형평성 측면에서 문제를 야기할 수 있습니다. 역할과 이에 따른 기대치 차이를 고려하지 않은 평가이기 때문이지요. 이러한 문제를 해결하기 위해 레몬베이스는 구성원이 속한 조직, 직급, 직군, 직책, 역할 등의 속성에 따라 ‘등급 가이드’를 작성해 각 속성에 부합하는 평가 대상자에게 맞춤형 가이드를 전달할 수 있는 기능을 제공합니다. 평가 대상자인 구성원은 자기 평가를 작성할 때부터 이러한 가이드를 참고하기 때문에 본인이 최종적으로 받은 등급의 의미를 보다 명확히 이해할 수 있습니다. 평가자 역시 평가 대상자의 속성에 따라 어떤 기준으로 등급을 부여해야 할지를 참고하면서 판단을 내릴 수 있습니다.

운영자(어드민)가 기본적으로 직무기술서를 참고해 역할과 핵심 역량을 이해하더라도, 개별 구성원의 모든 속성에 따라 등급 차이를 설명하는 가이드를 작성하는 것이 쉽지 않을 것입니다. 등급 가이드를 처음 마련하는 것이라면, (a) 직책자와 비직책자를 구분하여, 비직책자와 구분되는 직책자로서 팀장의 역할과 이에 따른 평가 기준으로서 등급을 구분하거나 (b) 등급을 가르는 ‘성과 차이를 판단하기 어렵다’는 평가자들의 고충이 다수 접수된 직군부터 먼저 가이드를 제공한다든지 등 우선순위를 정하는 것부터 시작해보세요.

레몬베이스가 제공하는 '직책별 등급 가이드의 예시'

※ 위 [표2], [표3]의 직책별, 직군별 예시는 각 회사에서 정의한 직책자 역할, 직군별 핵심 역량 등에 따라 수정하여 활용하면 됩니다. 예시에서는 직책자와 비직책자에게 기대되는 영향력의 차이, 각 직군별 평가 등급의 구분 등을 중점적으로 참고할 수 있습니다.

일관성 유지를 위한 체크리스트 역할

등급 가이드는 평가자가 미리 합의된 기준을 명확히 이해하고 이를 모든 평가 대상자에게 일관되게 적용할 수 있도록 돕는 일종의 ‘체크리스트’ 역할을 할 수 있어야 합니다.(링크) 평가자에게 문항에 응답하기 전 확인할 수 있는 등급 가이드를 제공하였더라도, 평가자도 사람인지라 일부 평가 대상자에게 유리한 방향으로 응답을 남겼을 가능성이 있습니다. 따라서 평가를 작성한 후 혹시라도 편향된 시각으로 인해 기준에서 벗어난 평가를 남기지는 않았는지 제출 전에 한번 더 살펴볼 때도 등급 가이드를 체크리스트로 활용하도록 안내할 수 있습니다.

추가영(gaby@lemonbase.com)

추가영(gaby@lemonbase.com)

레몬베이스에서 쌓은 지식을 콘텐츠에 담아 널리 알리고 있습니다. 합류 전 한국경제신문에서 기자로 일하며 혁신 기업을 일군 기업가들에 대한 이야기를 전했고, 『파워풀』을 번역하면서 한사람 한사람 저마다 가진 ‘힘’에 주목하게 되었습니다. 이후 혁신을 이끄는 사람과 문화를 관찰하고 기록하는 일을 이어가고 있습니다.