본문 바로가기

데이터 분석/Analytics13

[행동데이터분석] 인과관계 다이어그램 인과관계 다이어그램 인과관계 다이어그램(causal diagram)은 변수를 상자로 표현하고 변수 사이의 관계를 상자 사이의 화살표로 표현한 그림입니다. 예시에서 '아이스 커피 매출'은 '기온'의 영향을 받고, 이를 그림으로 나타내면 아래와 같습니다. 관찰할 수 없는 변수가 존재하는 경우도 있습니다. 이럴 때는 더 어두운 색의 상자를 사용합니다. 인과관계 다이어그램은 행동 사이의 인과관계를 나타내는 그림입니다. 이때 행동뿐만 아니라 행동에 영향을 미치는 현실 세계의 다른 현상을 나타내기도 합니다. 인과관계 다이어그램으로 현실 세계에 대한 직관과 신념을 표현했을 때 어느 정도의 주관이 담기는 것은 어쩔 수 없습니다. 인과관계 다이어그램은 사고와 분석을 위한 도구이기 때문에 담고 있는 모든 내용이 ‘사실’일.. 2023. 12. 21.
[행동데이터분석] 행동 데이터를 이해하는 방법 행동 모델 인간 행동 이해를 위한 모델 몇 가지 중 하나는 아래와 같습니다. 이 밖에도 다양한 모델이 있지만 이 책에서는 아래 5가지 요소로 구성된 모델을 사용합니다. 개인 특성은 인지와 감정에 영향을 미치고, 이것은 다시 의도에 영향을 줍니다. 의도는 결국 행동에도 영향을 줍니다. 비즈니스 행동(제어 가능한 프로세스, 규칙, 결정)은 개인 특성을 제외한 나머지 세 요소에 영향을 줍니다. 각각의 요소에 대해 좀 더 자세히 알아볼까요? 개인 특성 개인 특성은 분석 기간 동안 드물게 혹은 굉장히 점진적으로만 변하는 모든 개인 정보를 의미합니다. 대표적인 것이 인구통계 변수입니다. 인구 통계 변수가 기여 요소로 작용하면 좀 더 심리적이고 실용적인 개인 특성을 유추하는데 유용하게 사용할 수 있습니다. 따라서 개.. 2023. 12. 20.
[행동데이터분석] 인과-행동 프레임 워크 데이터 분석의 목적 데이터 분석을 하는 목적은 단지 현상 파악에 그치지 않고 ‘인간의 행동’을 변화시키기 위함에 있습니다. 그러려면 무엇이 인간의 행동을 유발하는지 알아야 합니다. 저자는 데이터 분석, 행동 과학적인 사고방식, 인과관계 분석 도구 모음을 결합한 ‘인과-행동 프레임워크’라는 접근법으로 이 목표를 이룰 수 있다고 생각합니다. 저자는 분석의 유형을 3가지로 나눕니다. 기술 분석, 예측, 인과관계. 기술 분석은 설명, description입니다. 예측 분석은 말 그대로 예측, 즉 측정하지 않은 것에 대해 알려줍니다. 마지막 인과관계 분석(causal analytics)은 인과관계를 제공합니다. 잘 알려진 인과관계 분석 도구는 A/B test와 같은 무작위 실험이고, 이런 실험이 불가능한 환경에서.. 2023. 12. 19.
Causal Impact - 인과효과 측정을 위한 방법론 데이터 분석을 하면서 이런 생각이나 궁금증을 가져본 적이 있으실 것 같아요. “지표가 의미 있게 좋아졌는데 이게 정말 이번 제품 개선의 효과라고 볼 수 있을까?”, “분명 기대가 큰 프로젝트였는데 왜 지표 변화는 없다고 나올까?”, “이번에 배포하면서 광고도 같이 집행했는데 성과 분석을 어떻게 하면 좋을까?” 데이터 분석가의 고민 사전에 A/B Test를 통해 제품 개선이나 다른 변경사항에 대한 효과를 확인해보는 것이 가장 좋겠지만, 회사마다 또는 여러 가지 상황에 따라 그렇지 못한 경우도 많습니다. 결국 변화에 대한 효과를 사후에 측정할 수밖에 없는 경우가 발생하는데, 이때 변경 전과 후에 달라지는 부분이 반드시 ‘내가 관심 있는 그것’ 한 가지뿐인 경우는 사실 드뭅니다. 그렇기 때문에 여러 가지 어려.. 2022. 3. 4.
[Python] list 형태의 string 값을 list로 변환하기 데이터 전처리 과정에서 list의 모습을 한 string 값을 진짜 list 타입으로 변환하여 처리해야 하는 상황이 간혹 발생합니다. # x의 type은 string x = '["A","B","C","D"]' # 이것을 아래처럼 list type으로 바꿔야 하는 상황 x = ["A", "B", "C", "D"] 몇 가지 간단한 해결 방법을 소개해 드릴게요. 1. 'json' 모듈 import json x = '["A","B","C","D"]' result = json.loads(x) # result # ['A', 'B', 'C', 'D'] 2. AST(Abstract Syntax Trees) 모듈의 literal_eval 함수 import ast x = '["A","B","C","D"]' result =.. 2022. 2. 8.
이력서/자기소개서 작성팁, 데이터 분석 결과로 짚어보기 채용공고 & 이력서 유사도와 서류전형 결과와의 관계 “왜 누군가는 내가 지원한 채용공고에 서류 합격을 했는데 나는 떨어졌을까?” “그런 사람들과 나는 어떤 점에서 차이가 있었을까?” “내가 부족한 점은 무엇일까?” 구직 활동을 해본 사람이라면 한 번쯤(혹은 자주?) 가져봤을 궁금증입니다. 이 프로젝트는 이런 궁금증에서 출발하게 되었는데요, 서류전형 결과에 영향을 미칠 것으로 예상되는 요인 가운데 이력서와 자기소개서가 주는 영향에 대하여 분석을 해보았습니다. 과연 이력서와 자기소개서를 어떻게 작성해야 서류 합격 확률을 높일 수 있을까요? 분석 개요 가설 채용공고의 내용과 이력서(자기소개서) 내용의 유사도가 서류합격에 유의미한 영향을 미칠 것 (유사도가 높을수록 서류합격 가능성은 높아질 것) 데이터 수집 요.. 2022. 1. 2.
반응형