본문 바로가기

분산3

z 검정, 두 그룹의 비율/평균은 차이가 있는가 (3) 오늘은 '평균 차이' 검증에 대한 이야기입니다. '비율 차이' 검증을 다룬 앞의 글 두 편을 먼저 읽고 오시면 좋습니다. z검정, 두 그룹의 비율/평균은 차이가 있는가 (1) z검정, 두 그룹의 비율/평균은 차이가 있는가 (2) ‘평균 차이’도 z검정으로 평균값에 대해서도 이것이 우연한 차이인지 의미 있는 차이인지 z검정을 통해 확인해 볼 수 있습니다. 예시를 함께 보도록 해요. 아래는 마케팅용 DM을 수신한 그룹과 그렇지 않은 그룹이 어떤 서비스에서 유료 결제를 한 상황을 요약한 표입니다. 평균 결제금액 표준편차 사례수 A. DM 수신 8만원 1.2만원 600 B. DM 미수신 7만원 1.0만원 400 Total 200 800 1,000 평균 차이 z검정에서도 '표준오차'와 '신뢰구간'을 알아야 합니다.. 2022. 2. 4.
z 검정, 두 그룹의 비율/평균은 차이가 있는가 (2) 앞의 글 - z검정, 두 그룹의 비율/평균은 차이가 있는가 (1) 을 먼저 읽고 오시면 좋습니다. ‘비율 차이’의 표준오차 ‘비율 차이’를 검증한다는 건 결국 ‘비율 차이’의 ‘표준오차’와 ‘신뢰구간’이 필요하다는 의미입니다. 그렇다면 ‘비율 차이’의 표준오차는 어떻게 구할 수 있을까요? 이 부분은 수식을 전개하면서 이해하는 것보다 정리된 공식을 먼저 보는 것이 좋을 것 같습니다. 결제 미결제 Total A. DM 수신 126 474 600 B. DM 미수신 74 326 400 Total 200 800 1,000 두 그룹 결제율 차이의 표준오차 $$ =\sqrt{\frac{\mathit{p_{t}}\times (1-\mathit{p_{t}})}{{\mathit{n_{a}}}}+\frac{\mathit{p.. 2022. 1. 26.
'분산'과 '표준편차'로 데이터 포착하기 앞에서 우리는 비즈니스에서 ‘관심을 보여야 하는 숫자(outcome)’와 그것을 표현하는 대표적인 방법인 ‘평균’에 대해서 알아봤습니다. 비즈니스에서 가치 있는 데이터 분석 '평균'이 '중앙값', '최빈값'보다 유용한 이유 '평균'은 물론 데이터를 이해하는 데 중요한 값이지만, 현상 파악을 위해서, 보다 명확한 인과관계 통찰을 위해서는 다른 대푯값에 대한 이해도 필요합니다. 오늘은 데이터의 퍼짐 정도, 즉 데이터의 불규칙성을 표현하는 다른 대푯값인 ‘분산’과 ‘표준편차’에 대한 내용을 정리해볼게요. '분산'으로 데이터의 펼쳐진 정도 확인하기 평균이 도출된 방법을 다시 한번 살펴보겠습니다. 평균값은 그것을 참값이라고 가정했을 경우 실제 데이터에 포함되는 '참값'에서 벗어난 값'을 최소화하는 값입니다. 정확.. 2022. 1. 5.
반응형