Post

A/B Test

Based on the following lectures
(1) “Statistics (2018-1)” by Prof. Sang Ah Lee, Dept. of Economics, College of Economics & Commerce, Kookmin Univ.
(2) "Statistical Models and Application (2024-1)" by Prof. Yeo Jin Chung, Dept. of Data Science, The Grad. School, Kookmin Univ.

What? A/B Test


01

  • A/B Test : 서로 다른 두 방법 간 효과의 차이를 밝히기 위한 대조 실험

    상관관계(Correlation) 를 파악하고자 하는 변수 $Y,X$ 외에 다른 요인들을 직접 통제할 수 없을 때 사용되는 통계적 디자인 패턴으로서, 임의로 나눈 두 집단에 대하여 서로 다른 방법을 적용하고 어떤 집단이 더 높은 성과를 보이는지 판단함. 이때 두 집단을 무작위로 추출함으로써, 두 집단이 제3의 요인들에 대하여 완전히 동질적일 수는 없지만 확률적으로 유사한 분포를 가지도록 함.

refer. Correlation VS. Causality


02

Example: 아이스크림 판매량과 물놀이 사고 간 관계성

한 지자체에서 물놀이 사고를 줄이는 것을 목표로 하고 있다. 조사 결과 아이스크림 판매량과 물놀이 사고 빈도 간의 상관관계가 높음을 알 수 있었다. 즉, 아이스크림 판매량이 증가하면 물놀이 사고가 증가하는 것이 데이터로부터 파악되었다. 이를 근거로 아이스크림 판매량 증가가 물놀이 사고 증가의 원인이라고 판단하였고, 물놀이 사고를 줄이기 위해 아이스크림 가격을 올려 판매량을 줄이는 정책을 입안하였다.

  • 아이스크림 판매량과 물놀이 사고를 동시에 증가시키는 제3의 요인이 존재한다면?

03

Example: 웹사이트 디자인 개편과 매출 증가 간 관계성

어떤 쇼핑몰 웹 사이트에서 3개월에 걸쳐 디자인 개편 프로젝트를 진행하였고, 지난주에 성공적으로 새 디자인을 적용하였다. 그랬더니 갑자기 그 전에 비해 일 매출이 $10\%$ 증가했다. 매출 증가는 웹사이트 디자인 개편 덕분이라고 판단할 수 있는가?

  • 새 디자인이 적용된 날 갑자기 경쟁 쇼핑몰이 문을 닫았다면?
  • 새 디자인이 적용된 날 갑자기 인기 상품이 입고되었다면?
  • 새 디자인이 적용된 날 갑자기 경기가 좋아졌다면?

Mean of a continuous random variable


문제 관심모수 점추정량 가정 검정가설 검정방법
단일 집단의 평균 $\mu$ $\bar{X}$ $n>30$ $H_0: \mu=\mu_0$ One Sample t-Test
두 집단 간 평균 비교
(독립표본)
$\mu_1-\mu_2$ \(\bar{X}_{1} - \bar{X}_{2}\) $(n_1 + n_2)>30$ $H_0: \mu_1 - \mu_2 = 0$ Two Sample t-Test
두 집단 간 평균 비교
(쌍체표본)
$\mu_d$ $\bar{X}_d$ $n>30$ $H_0: \mu_d=0$ Paired Sample t-Test
셋 이상 그룹 간 평균 비교 $\mu_1, \cdots, \mu_m$ $\bar{X}_1, \cdots, \bar{X}_m$ $n_i>30$
$\sigma_{i}^{2}=\sigma_{j}^{2}$
$H_0: \mu_1 = \cdots = \mu_m$ ANOVA

Proportion of a discrete random variable


문제 관심모수 점추정량 가정 검정가설 검정방법
단일 집단의 비율 $\pi$ $p$ $np>5$
$n(1-p)>5$
$H_0: \pi=\pi_0$ One Sample z-Test
두 집단 간 비율 비교 $\pi_1 - \pi_2$ $p_1 - p_2$ $n_i p_i > 5$
$n_i (1-p_i)>5$
$H_0: \pi_1-\pi_2=0$ Two Sample z-Test
적합성 검정 $\pi_1, \cdots, \pi_m$ $p_1, \cdots, p_m$ $n_i p_i > 5$
$n_i (1-p_i)>5$
$H_0: \pi_1=p_{0}^{(1)}, \cdots, \pi_m=p_{0}^{(m)}$ Chi-square test
독립성 검정     $n_i p_i > 5$
$n_i (1-p_i)>5$
$H_0:$ 두 범주형 변수가 독립 Chi-square test

Sourse

  • https://varify.io/en/blog/ab-testing/
This post is licensed under CC BY 4.0 by the author.