데이터 분석의 목적
데이터 분석을 하는 목적은 단지 현상 파악에 그치지 않고 ‘인간의 행동’을 변화시키기 위함에 있습니다. 그러려면 무엇이 인간의 행동을 유발하는지 알아야 합니다. 저자는 데이터 분석, 행동 과학적인 사고방식, 인과관계 분석 도구 모음을 결합한 ‘인과-행동 프레임워크’라는 접근법으로 이 목표를 이룰 수 있다고 생각합니다.
저자는 분석의 유형을 3가지로 나눕니다. 기술 분석, 예측, 인과관계. 기술 분석은 설명, description입니다. 예측 분석은 말 그대로 예측, 즉 측정하지 않은 것에 대해 알려줍니다. 마지막 인과관계 분석(causal analytics)은 인과관계를 제공합니다. 잘 알려진 인과관계 분석 도구는 A/B test와 같은 무작위 실험이고, 이런 실험이 불가능한 환경에서는 ‘인과관계 다이어그램’을 사용합니다.
인과관계 분석과 예측 분석의 차이점
인과관계 분석은 예측 분석과 동일한 도구를 사용합니다. 다만 차이가 있다면, 예측 분석은 예측한 값과 정확도가 가장 중요합니다. 인관관계 분석도 회귀를 사용하지만 목표변수의 값을 측정하는 것만이 목표가 아닙니다. 대신 측정값을 유도한 요인이 무엇인가에 초점을 맞춥니다. 잘 설계된 회귀 분석에서 상관계수는 종속변수에 대한 독립변수의 인과 효과를 나타내는 좋은 지표가 될 수 있습니다.
그럼 잘 설계된 회귀 분석은 무엇일까요? 독립 변수들을 정확한 예측을 목표로 설정하기보다는 정확한 관계의 계수를 가질 수 있도록 설계해야 합니다. 그래서 예측 분석을 위한 변수 구성과 인과관계 분석을 위한 변수 구성은 조금 다릅니다.
보통 예측을 잘하기 위해서는 교란 현상을 해결해야 합니다. 교란 변수는 회귀모델에 편향을 조성하는 변수입니다. 교란 현상을 해결하기 위한 잠재적인 방법은 회귀 모델에 가능한 모든 변수를 포함하는 것입니다. 하지만 이런 방식은 인과관계 이해와 의사결정에 도움을 주지 않습니다. 분석 모델에 가능한 모든 변수를 포함하는 것은 비효율적이고, 역효과와 결과 왜곡을 낳습니다.
이 글은 <행동 데이터 분석> 책을 읽고 주요 내용과 제 생각을 정리한 글입니다.
Part 1 행동의 이해
Chapter 1 인과-행동 프레임 워크
'데이터 분석 > Analytics' 카테고리의 다른 글
[행동데이터분석] 인과관계 다이어그램 (1) | 2023.12.21 |
---|---|
[행동데이터분석] 행동 데이터를 이해하는 방법 (0) | 2023.12.20 |
Causal Impact - 인과효과 측정을 위한 방법론 (1) | 2022.03.04 |
[Python] list 형태의 string 값을 list로 변환하기 (0) | 2022.02.08 |
이력서/자기소개서 작성팁, 데이터 분석 결과로 짚어보기 (0) | 2022.01.02 |
댓글