본문 바로가기
데이터 분석/Statistics

비즈니스에서 가치 있는 데이터 분석

by 친절한 휘저씨 2021. 12. 24.

무슨 값을 어떻게 정리해야 하는가

 

인과관계의 통찰에서 가장 중요한 것은 '무슨 값을 어떻게 정리해야 하는지' 아는 지혜라고 저자는 말합니다. 그리고 이것은 실용 통계학에서 반드시 알아야 할 부분이라고 강조하고 있어요. 여기서 '인과관계'란 어떤 원인에 의해 결과가 어떻게 변하는지를 알아내는 것입니다.

이런 인과관계를 파악하기 위해 회사에서는 사업과 관련된 여러 가지 숫자들을 고객의 특징에 따라 나누어 분석합니다. 이런 결과를 누구나 한 번쯤은 보았거나 직접 만들어봤을 거예요. 하지만, 고객의 특징(ex. 성, 연령, 가입시점 등)이나 분석하고자 하는 숫자를 쪼개어 볼 만한 또 다른 기준(ex. 제공하는 제품/서비스 종류 등)은 실로 굉장히 다양합니다. 그렇기 때문에 사람들은 이 모든 항목별로 보고자 하는 숫자(지표)들을 각각 확인해 볼 생각을 쉽게 하지 못합니다. 그래서 대다수의 사람들은 경험과 직감에 근거하여 가설을 세우고, 거기에만 집중을 하는 모습을 보이곤 합니다. 



아웃풋(output)과 아웃컴(outcome)

비즈니스에서도 가치 있는 데이터 분석은
'최대화하거나 최소화해야 하는 항목'이 무엇인지 알아내는 것이다.
이것이 아웃컴이다. 


여기서 저자는 아웃풋과 아웃컴을 구분할 필요가 있다고 말합니다. 저자는 아웃컴'최종적으로 조절하고 싶은 결과'를 지칭할 때 사용합니다. 그리고 아웃컴에 영향을 미칠 수 있거나 차이를 설명할 수 있을지도 모르는 요인'설명변수(explanatory variable)'라고 부릅니다. 아웃컴과 유사한 표현은 우리가 많이 들어본 '결과변수', '목적변수', '종속변수'가 있지요. 하지만, 저자가 '아웃컴'이라는 표현을 사용하는 이유는 여러 데이터가 측정되고 분석되는 과정에서 무엇을 최대화 혹은 최소화해야 하는가 하는 의식이 철저히 내재된 표현이기 때문입니다.

'아웃컴'이라는 표현은 주로 의학, 정책과학 분야에서 사용되는데, 좋은 연구나 분석이 사회에 유익한 결과를 가져와야 한다는 사고방식이 바탕을 이루고 있습니다. 예를 들어, "그 정부 정책을 통해 사회에 어떤 좋은 결과를 가져왔는가" 하는 부분은 '아웃컴'을 다루는 관점입니다. 하지만, "새로운 정책의 인식률이 몇 퍼센트였습니다", "자료의 청구가 몇 건 있었습니다" 에서 다루는 숫자는 아웃컴이 아닌, '아웃풋'을 다룬 내용이라고 볼 수 있습니다. 

 

이런 관점을 회사에도 한 번 적용해 볼까요? '매출'이나 '판매량'은 비즈니스에서 최대화해야 하는 항목이니 아웃컴이라고 볼 수 있습니다. 반면, '광고에 노출된 유저수' 같은 것들은 '과정'을 보여주는 숫자이기 때문에 아웃풋이라고 볼 수 있습니다. 물론, 고객의 여정, 퍼널 분석은 중요합니다. 그러나 이 여정에서 만들어진 숫자는 회사가 (진실로) 최종적으로 원하는 숫자와 다른 경우가 더 많습니다. (아웃컴을 반드시 매출 관련 지표로만 이해하지 않아도 될 것 같아요. '핵심 성과지표'라는 것은 회사가 처한 상황과 환경에 따라 얼마든지 달라질 수 있으니까요.) 어쨌든 여기서 중요한 건, 다양한 종류의 숫자 가운데, 현재 회사에서 중요하게 여기는 숫자에 집중하고, 이 숫자들이 '무엇에 의해서 움직이는지' 찾고자 하는 것입니다. 즉, 우리의 탐구 대상을 정말 중요한 것들로만 좁혀보는 것이죠. 



설명변수의 우선순위 매기기

 

'원인'과 '결과' 중 봐야 할 '결과'를 줄이는 데 성공했다면, 그다음은 '원인'을 줄여볼 차례입니다. 이것은 앞서 말씀드렸던, 고객의 특징, 혹은 숫자를 쪼개어 볼 만한 여러 가지 기준, 항목들을 의미합니다. 

 

인과관계가 '너무 당연한 것'이어서는 안 된다
아웃컴에 미치는 영향이 명백하더라도 조절이 가능해야 한다
지금까지 그다지 주목받지 않고 분석된 적이 별로 없어야 한다

"고객이 많아지면 매출이 오른다", "고객 1인당 사용금액이 늘어나면 매출이 오른다"는 말은 누구라도 생각할 수 있는 말입니다. 아웃컴에 (당연히) 영향을 미치는 KPI(Key Performance Indicator)와 같은 것들은 평소 모니터링에는 유용하지만, 이것이 새로운 인과관계를 통찰하거나 이익을 창출하는 아이디어로는 이어지지는 않습니다.

"이 원인을 바꾸기만 하면 매출을 늘릴 수도 있다"는 결과를 얻었는데, 정작 이 원인을 바꾸는 것이 불가능하다면 결국 탁상공론으로 끝날뿐입니다. 예를 들어, B2B 서비스를 제공하는 회사에서 고객사와의 계약 성사가 수요일과 목요일에 더 많이 몰린다는 사실을 알게 되더라도 요일을 바꿀 수는 없는 노릇입니다. 월요일과 화요일의 계약 성사 건수를 좀 더 늘리기 위해 영업이나 마케팅 활동을 늘리더라도 이것이 일반적인 기업들의 생산성(일반적으로 월요일과 금요일의 업무 집중도가 떨어지는 것과 같은)과 관련된 부분이기 때문에 그 효과가 클 것으로 기대하기는 어려울 수도 있습니다.

그래서 저자는 그동안 경험적으로, 그리고 습관적으로 찾던 항목들 이외의 다른 것들, 그러면서도 조절 가능한 것들을 살펴보는 것이 새로운 발견으로 이어질 가능성이 높다고 말합니다. '관계가 있는지 없는지 모르는 항목'일수록 새로운 발견으로 이어질 가능성은 높습니다. 의식적으로 이런 항목들과 아웃컴이 어떤 관계를 갖는지 확인해 보려는 노력을 기울이는 것이 중요할 것으로 생각됩니다. 

 

 

'관성'을 이겨내기

 

오늘 함께 살펴본 내용은 데이터 분석가에게 시사하는 바가 많다고 생각됩니다. 몸 담고 있는 회사의 제품과 서비스에 어느 정도 익숙해진 분석가들은 그간의 분석 결과들과 경험적으로 확인한 사실들에 갇혀 새로운 발견을 위한 분석에 게을러지는 경우가 종종 생깁니다. "이제 여기서는 더 볼 게 없는 것 같아"라는 자조나 푸념이 섞인 말을 뱉기도 합니다. 하지만, 잘 생각해보면, 지금 이 순간에도 조직에는 미처 해결되지 않은 호기심들이 쌓여있고, 풀어야 할 문제 또한 많습니다. 데이터로 이런 문제풀이를 돕는 분석가에게는 늘 새로운 발견을 할 기회가 열려있다는 생각도 듭니다. 가끔은 새로운 기분과 생각으로 조금은 다른 움직임을 가져갈 필요가 있을 것 같기도 합니다. 의식적으로 '관성'을 이겨내도록 노력해봐야겠습니다. 🙂 



이 글은 <통계의 힘: 실무활용 편 (니시우치히로무 지음)> 을 읽고, 책의 내용 일부와 저의 생각을 담아 적었습니다. 

 

 

 

반응형

댓글