본문 바로가기

행동 데이터4

[행동데이터분석] 인과관계 다이어그램 그리기 - (2) 변수 검증/확장/단순화 3. 데이터 기반으로 변수 검증하기 인과관계 다이어그램에 넣을 변수 식별이 끝나면 관찰 가능한 변수만 남겨 봅니다. 관찰 가능한 변수는 관심 대상인 두 변수와 모두 잠정적으로 연결됩니다. 그러나 어떤 경우에는 예측 변수를 관심 변수 중 하나에만 연결해야 하는 매우 강력한 경험적 근거가 있을 수 있습니다. 하지만 확신이 없다면 두 관심 변수에 모두 연결하는 것이 안전합니다. 3-1. 숫자형 변수 검증 숫자형 변수의 상관계수 행렬을 확인하는 과정입니다. 이진형 변수는 0/1로 변환합니다. 관심 요인 및 효과와의 상관관계 강도를 확인하고 강한 상관관계를 갖는 관계만 남기게 됩니다. 경험에 따르면 관심 요인과 관심 효과 사이의 상관관계와 같은 크기 정도면 ‘강한 상관관계’라고 간주할 수 있습니다. 변수 포함 여.. 2023. 12. 28.
[행동데이터분석] 인과관계 다이어그램 그리기 - (1) 변수 식별 인과관계 다이어그램을 만들 때는 비즈니스 감각과 상식, 데이터 통찰력이 중요합니다. 인과관계 다이어그램은 다음과 같은 순서로 만듭니다. - 잠재적으로 포함될 수 있거나 포함되어야 하는 변수 식별 - 변수를 포함해야 하는지 결정 - 필요에 따라 과정 반복 - 다이어그램 단순화 1. 관심 대상의 관계 이해 예시에서는 호텔의 실제 예약 정보 데이터셋을 활용합니다. 관심 있는 문제는 “보증금 유형이 예약 취소율에 영향을 주는가?”입니다. 제일 먼저 할 일은 이 두 데이터의 관계를 확인하는 것입니다. 데이터를 확인해보면 보증금 없는 예약 건수가 압도적으로 많고 취소율은 약 27%입니다. 반면 환불불가 보증금이 있는 예약의 취소율은 약 95%로 매우 높습니다. 따라서 보증금 여부와 취소율은 강한 상관관계를 보여줍니.. 2023. 12. 28.
[행동데이터분석] 행동 데이터를 이해하는 방법 행동 모델 인간 행동 이해를 위한 모델 몇 가지 중 하나는 아래와 같습니다. 이 밖에도 다양한 모델이 있지만 이 책에서는 아래 5가지 요소로 구성된 모델을 사용합니다. 개인 특성은 인지와 감정에 영향을 미치고, 이것은 다시 의도에 영향을 줍니다. 의도는 결국 행동에도 영향을 줍니다. 비즈니스 행동(제어 가능한 프로세스, 규칙, 결정)은 개인 특성을 제외한 나머지 세 요소에 영향을 줍니다. 각각의 요소에 대해 좀 더 자세히 알아볼까요? 개인 특성 개인 특성은 분석 기간 동안 드물게 혹은 굉장히 점진적으로만 변하는 모든 개인 정보를 의미합니다. 대표적인 것이 인구통계 변수입니다. 인구 통계 변수가 기여 요소로 작용하면 좀 더 심리적이고 실용적인 개인 특성을 유추하는데 유용하게 사용할 수 있습니다. 따라서 개.. 2023. 12. 20.
[행동데이터분석] 인과-행동 프레임 워크 데이터 분석의 목적 데이터 분석을 하는 목적은 단지 현상 파악에 그치지 않고 ‘인간의 행동’을 변화시키기 위함에 있습니다. 그러려면 무엇이 인간의 행동을 유발하는지 알아야 합니다. 저자는 데이터 분석, 행동 과학적인 사고방식, 인과관계 분석 도구 모음을 결합한 ‘인과-행동 프레임워크’라는 접근법으로 이 목표를 이룰 수 있다고 생각합니다. 저자는 분석의 유형을 3가지로 나눕니다. 기술 분석, 예측, 인과관계. 기술 분석은 설명, description입니다. 예측 분석은 말 그대로 예측, 즉 측정하지 않은 것에 대해 알려줍니다. 마지막 인과관계 분석(causal analytics)은 인과관계를 제공합니다. 잘 알려진 인과관계 분석 도구는 A/B test와 같은 무작위 실험이고, 이런 실험이 불가능한 환경에서.. 2023. 12. 19.
반응형