본문 바로가기

인과관계7

[행동데이터분석] 조절효과 - 세분화, 상호작용, 비선형성 조절효과(moderation)의 (기술적) 정의는 매우 간단합니다. 두 예측 변수 사이의 곱셈 회귀 분석을 의미합니다. 조절효과를 통해 다음과 같은 행동학적 현상을 이해할 수 있습니다. - 세분화(segmentation) - 상호작용(interaction) - 비선형성(nonlinearity) (자기조절 self-moderation) 세분화 고객 세그먼트를 구축하는 것은 마케팅 분석, 더 넓게는 비즈니스 분석의 핵심 작업입니다. 예시로 ‘고객이 매장에 머무르는 시간’에 ‘놀이 공간’이 어떤 영향을 미쳤는지 알아봅시다. 인과관계 다이어그램을 기반으로 회귀분석을 수행하면 평균 인과 효과를 알 수 있습니다. 하지만 평균은 오해의 소지가 있으며 모집단의 세그먼트 사이에 존재하는 차이를 파악하지 못하게 합니다. .. 2024. 1. 17.
[행동데이터분석] 인과관계 다이어그램 그리기 - (2) 변수 검증/확장/단순화 3. 데이터 기반으로 변수 검증하기 인과관계 다이어그램에 넣을 변수 식별이 끝나면 관찰 가능한 변수만 남겨 봅니다. 관찰 가능한 변수는 관심 대상인 두 변수와 모두 잠정적으로 연결됩니다. 그러나 어떤 경우에는 예측 변수를 관심 변수 중 하나에만 연결해야 하는 매우 강력한 경험적 근거가 있을 수 있습니다. 하지만 확신이 없다면 두 관심 변수에 모두 연결하는 것이 안전합니다. 3-1. 숫자형 변수 검증 숫자형 변수의 상관계수 행렬을 확인하는 과정입니다. 이진형 변수는 0/1로 변환합니다. 관심 요인 및 효과와의 상관관계 강도를 확인하고 강한 상관관계를 갖는 관계만 남기게 됩니다. 경험에 따르면 관심 요인과 관심 효과 사이의 상관관계와 같은 크기 정도면 ‘강한 상관관계’라고 간주할 수 있습니다. 변수 포함 여.. 2023. 12. 28.
[행동데이터분석] 인과관계 다이어그램 그리기 - (1) 변수 식별 인과관계 다이어그램을 만들 때는 비즈니스 감각과 상식, 데이터 통찰력이 중요합니다. 인과관계 다이어그램은 다음과 같은 순서로 만듭니다. - 잠재적으로 포함될 수 있거나 포함되어야 하는 변수 식별 - 변수를 포함해야 하는지 결정 - 필요에 따라 과정 반복 - 다이어그램 단순화 1. 관심 대상의 관계 이해 예시에서는 호텔의 실제 예약 정보 데이터셋을 활용합니다. 관심 있는 문제는 “보증금 유형이 예약 취소율에 영향을 주는가?”입니다. 제일 먼저 할 일은 이 두 데이터의 관계를 확인하는 것입니다. 데이터를 확인해보면 보증금 없는 예약 건수가 압도적으로 많고 취소율은 약 27%입니다. 반면 환불불가 보증금이 있는 예약의 취소율은 약 95%로 매우 높습니다. 따라서 보증금 여부와 취소율은 강한 상관관계를 보여줍니.. 2023. 12. 28.
[행동데이터분석] 인과관계 다이어그램 인과관계 다이어그램 인과관계 다이어그램(causal diagram)은 변수를 상자로 표현하고 변수 사이의 관계를 상자 사이의 화살표로 표현한 그림입니다. 예시에서 '아이스 커피 매출'은 '기온'의 영향을 받고, 이를 그림으로 나타내면 아래와 같습니다. 관찰할 수 없는 변수가 존재하는 경우도 있습니다. 이럴 때는 더 어두운 색의 상자를 사용합니다. 인과관계 다이어그램은 행동 사이의 인과관계를 나타내는 그림입니다. 이때 행동뿐만 아니라 행동에 영향을 미치는 현실 세계의 다른 현상을 나타내기도 합니다. 인과관계 다이어그램으로 현실 세계에 대한 직관과 신념을 표현했을 때 어느 정도의 주관이 담기는 것은 어쩔 수 없습니다. 인과관계 다이어그램은 사고와 분석을 위한 도구이기 때문에 담고 있는 모든 내용이 ‘사실’일.. 2023. 12. 21.
[행동데이터분석] 인과-행동 프레임 워크 데이터 분석의 목적 데이터 분석을 하는 목적은 단지 현상 파악에 그치지 않고 ‘인간의 행동’을 변화시키기 위함에 있습니다. 그러려면 무엇이 인간의 행동을 유발하는지 알아야 합니다. 저자는 데이터 분석, 행동 과학적인 사고방식, 인과관계 분석 도구 모음을 결합한 ‘인과-행동 프레임워크’라는 접근법으로 이 목표를 이룰 수 있다고 생각합니다. 저자는 분석의 유형을 3가지로 나눕니다. 기술 분석, 예측, 인과관계. 기술 분석은 설명, description입니다. 예측 분석은 말 그대로 예측, 즉 측정하지 않은 것에 대해 알려줍니다. 마지막 인과관계 분석(causal analytics)은 인과관계를 제공합니다. 잘 알려진 인과관계 분석 도구는 A/B test와 같은 무작위 실험이고, 이런 실험이 불가능한 환경에서.. 2023. 12. 19.
비즈니스에서 가치 있는 데이터 분석 무슨 값을 어떻게 정리해야 하는가 인과관계의 통찰에서 가장 중요한 것은 '무슨 값을 어떻게 정리해야 하는지' 아는 지혜라고 저자는 말합니다. 그리고 이것은 실용 통계학에서 반드시 알아야 할 부분이라고 강조하고 있어요. 여기서 '인과관계'란 어떤 원인에 의해 결과가 어떻게 변하는지를 알아내는 것입니다. 이런 인과관계를 파악하기 위해 회사에서는 사업과 관련된 여러 가지 숫자들을 고객의 특징에 따라 나누어 분석합니다. 이런 결과를 누구나 한 번쯤은 보았거나 직접 만들어봤을 거예요. 하지만, 고객의 특징(ex. 성, 연령, 가입시점 등)이나 분석하고자 하는 숫자를 쪼개어 볼 만한 또 다른 기준(ex. 제공하는 제품/서비스 종류 등)은 실로 굉장히 다양합니다. 그렇기 때문에 사람들은 이 모든 항목별로 보고자 하는.. 2021. 12. 24.
숫자를 잘 활용하는 방법, '통찰'의 통계학 공부하기 업무와 관련된 책들을 가끔 읽고 있는데요, 소개해 드릴 만한 좋은 책이 있어서 앞으로 이 책에서 얻은 지식과 저의 생각을 꾸준히 공유해 보면 좋을 것 같습니다. 통계의 힘: 실무활용 편 (니시우치 히로무 지음) '통계학'을 다루니까 재미없고 딱딱해 보일 수 있지만, 잘 몰랐던 사실, 헷갈렸던 부분이 해소되는 즐거움을 주는 책이고, 읽다 보면 무릎을 탁 치는 순간이 여러 번 오는 신통한 책입니다. (그럼에도 불구하고 책이 다루는 내용이 다소 딱딱한 부분은 피하기 어렵습니다. 😅) 제목에서 엿볼 수 있듯이 이론보다는 ‘활용’의 관점에서 통계학의 여러 가지 개념들을 알려주는 책입니다. 그렇기 때문에 숫자를 자주 다루거나 통계 관련 지식을 업무에 활용해야 하는 분들께서 차근차근 읽고 개념을 다지기에 매우 좋은 .. 2021. 12. 20.
반응형