Student's t-Test
Based on the following lectures
(1) “Statistics (2018-1)” by Prof. Sang Ah Lee, Dept. of Economics, College of Economics & Commerce, Kookmin Univ.
(2) "Statistical Models and Application (2024-1)" by Prof. Yeo Jin Chung, Dept. of Data Science, The Grad. School, Kookmin Univ.
Student’s t-Test
-
스튜던트의 t 검정(Student’s t-Test): 독립표본 t 검정(Independent Samples t-Test) 중 등분산 t 검정으로서($\sigma_{1} = \sigma_{2}$), 등분산 가정이 성립하는 두 독립표본의 평균이 통계적으로 유의한 차이가 있는지 검정하는 방법
한 메이저 리그 야구경기를 마무리하는 데 걸리는 시간에 대한 우려가 팬과 구단주 사이에서 점차 더 커지고 있다. 이 문제의 심각성을 평가하기 위해서, 한 통계 전문가는 5년 전과 금년에 임의표본을 구성하는 경기들을 마무리하는데 걸린 시간을 기록하였다. 한 경기를 마무리하는 데 걸리는 시간이 5년 전보다 금년이 더 길다고 결론을 내릴 수 있는가?
-
모수(Parameter) 정의:
\[\begin{aligned} \mu_{1} - \mu_{2} \end{aligned}\] -
점 추정량(Point Estimator) 도출:
\[\begin{aligned} \overline{X}_{1}-\overline{X}_{2} \end{aligned}\] - 가설(Hypothesis) 설정:
- $H_{0}:\quad \mu_1-\mu_2=D_{0}$
- $H_{1}:\quad \mu_1-\mu_2 \ne D_{0}$
-
검정통계량(Test Statistic):
\[\begin{aligned} T \sim t(\nu_{1} + \nu_{2}) \end{aligned}\] -
합동분산(Pooled Variance): 등분산 가정이 성립하는 두 독립표분의 분산을 각각의 자유도로 가중평균한 값
\[\begin{aligned} s_{p}^{2} &= \frac{\nu_{1} \cdot s_{1}^{2} + \nu_{2} \cdot s_{2}^{2}}{\nu_{1} + \nu_{2}} \end{aligned}\]
Test Statistic
\[\begin{aligned} T &= \frac{(\overline{X}_1-\overline{X}_2)-D_{0}}{\sqrt{s_{p}^{2}/n_{1}+s_{p}^{2}/n_{2}}} \end{aligned}\]
-
\(\mathbb{E}\left[\overline{X}_{1}-\overline{X}_{2}\right]\):
\[\begin{aligned} \mathbb{E}\left[\overline{X}_{1}-\overline{X}_{2}\right] &= \mathbb{E}\left[\overline{X}_{1}\right] - \mathbb{E}\left[\overline{X}_{2}\right]\\ &= \mu_{1} - \mu_{2} \end{aligned}\] -
\(\mathrm{Var}\left[\overline{X}_{1}-\overline{X}_{2}\right]\):
\[\begin{aligned} \mathrm{Var}\left[\overline{X}_{1}-\overline{X}_{2}\right] &= \mathrm{Var}\left[\overline{X}_{1}\right] + \mathrm{Var}\left[\overline{X}_{2}\right] - 2 \times \mathrm{Cov}\left[\overline{X}_{1}, \overline{X}_{2}\right]\\ &= \mathrm{Var}\left[\overline{X}_{1}\right] + \mathrm{Var}\left[\overline{X}_{2}\right] \quad (\because \mathrm{Cov}\left[\overline{X}_{1}, \overline{X}_{2}\right] = 0)\\ &= \frac{s_{p}^{2}}{n_{1}} + \frac{s_{p}^{2}}{n_{2}} \end{aligned}\] -
Standardized $T$:
\[\begin{aligned} T &= \frac{(\overline{X}_{1}-\overline{X}_{2})-D_{0}}{s_{p}^{2}/n_{1} + s_{p}^{2}/n_{2}}\\ &= \frac{(\overline{X}_{1}-\overline{X}_{2})-(\mu_{1}-\mu_{2})}{s_{p}^{2}/n_{1} + s_{p}^{2}/n_{2}} + \frac{(\mu_{1}-\mu_{2})-D_{0}}{s_{p}^{2}/n_{1} + s_{p}^{2}/n_{2}}\\ &= \frac{(\mu_{1}-\mu_{2})-D_{0}}{s_{p}^{2}/n_{1} + s_{p}^{2}/n_{2}} \quad (\because \mathbb{E}\left[\overline{X}\right]=\mu) \end{aligned}\]