관리 메뉴

Bull

[Statistics] 이항분포의 평균과 분산 증명 본문

Math/Statistics

[Statistics] 이항분포의 평균과 분산 증명

Bull_ 2024. 4. 1. 19:00

확률분포와 이항분포의 정의

확률분포

확률분포는 이산확률분포와 연속확률분포로 나뉩니다.

 

여기서 이항분포는 이산확률분포를 따르니 이산확률분포를 설명하겠습니다. 

 

이산확률분포는 확률 변수 X의 치역이 셀 수 있는 집합인 경우의 확률변수 X를 나타낸 함수입니다.

 

즉, 모든 확률 변수가 특정한 값을 가질 확률을 나타내는 함수입니다.

이항분포

이항분포는 성공률이 p인 n회의 베르누이 시행에서 성공횟수를 X라 할 때, 확률변수 X의 확률분포입니다.


이항분포는 이산확률분포 중에서 발생결과가 오직 2가지 뿐인 베르누이 시행을 적용한 이산확률분포라고 생각할 수 있습니다.


따라서 이산확률분포의 평균과 분산의 공식을 통해 이항분포의 공식을 유도할 수 있습니다.

이항분포의 평균 증명


확률분포에서 평균은 다음과 같습니다.

 

$E(X) = \sum_{x=1}^{n}xf(x)$

 

여기서 f(x)는 확률변수 x에 대한 확률이므로 온전한 생김새를 위해 $x=x_i$,$f(x)=p_i$로 나타내겠습니다.

 

$E(X) = \sum_{i=1}^{n}x_ip_i$

 

이항분포의 특정 사건 r에 대한 확률은 다음과 같습니다.

 

$P(X=r) = \binom{n}{r}p^rq^{n-r}$

 

이제 이항분포의 공식을 사용하기 위해 확률분포의 공식에 변수를 마지막으로 한 번 더 통일시키겠습니다.

 

$E(X) = \sum_{r=1}^{n}rP(X=r)$


$E(X) = \sum_{r=1}^{n}r\binom{n}{r}p^rq^{n-r}$

 

이 상태에서 이항분포의 평균인 $E(X)=np$를 증명하겠습니다.

 

$E(X) = \sum_{r=1}^{n}r\binom{n}{r}p^rq^{n-r}$


$E(X) = \sum_{r=1}^{n}r\frac{n·(n-1)!}{(n-r)!·r!}p·p^{r-1}q^{n-r}$

 

우선 $\binom{n}{r}$를 Combination 공식으로 바꿔주었고 n과 p를 하나씩 분리시켰습니다.

 

$E(X) = np\sum_{r=1}^{n}r\frac{(n-1)!}{(n-r)!·r!}p^{r-1}q^{n-r}$

 

$E(X) = np\sum_{r=1}^{n}\frac{(n-1)!}{(n-r)!·(r-1)!}p^{r-1}q^{n-r}$

 

n과 p는 sigma식과 독립적이므로 밖으로 빼 주었습니다
그리고 r은 팩토리얼식으로 약분하였습니다.

 

$E(X) = np\sum_{r=1}^{n}\binom{n-1}{r-1}p^{r-1}q^{n-r}$

 

$\sum_{r=1}^{n}\binom{n-1}{r-1}p^{r-1}q^{n-r} = \binom{n-1}{0}p^{0}q^{n-1} + \binom{n-1}{1}p^{1}q^{n-2} + ... + \binom{n-1}{n-1}p^{n-1}q^{0} = 1$

 

이제 다시 Combination 공식을 이용해 식을 변형하였습니다.
그 다음 1인 이유는 식을 전개하는 것 보다 sigma식을 변형하여 설명하겠습니다.
$n-1=N,r-1= K$로 치환해봅니다.

 

$\sum_{K=0}^{n}\binom{N}{K}p^{K}q^{N-K} = 1$

 

이항분포 확률의 모든 합은 1이므로 공식이 성립됩니다. 

 

따라서 이항분포의 평균은 위와 같음을 증명했습니다.

이항분포의 분산 증명


$V(X) = \sum^n_{i=1}{x_i}^2p_i - m^2$

 

이산확률분포에서 분산은 위와 같이 나타낼 수 있습니다.

 

$V(X) = \sum^n_{r=1}\binom{n}{r}p^{r}q^{n-r} - (np)^2$

 

이전 방식과 같이 $n$,$r$과 $p$로 나타내 보았습니다.

 

$V(X) = \sum^n_{r=1}r^2\frac{n!}{(n-1)!·r!}p·p^{r-1}q^{n-r} - (np)^2$


$V(X) = \sum^n_{r=1}r\frac{n(n-1)!}{(n-1)!·(r-1)!}p·p^{r-1}q^{n-r} - (np)^2$


$V(X) = np\sum^n_{r=1}r\frac{(n-1)!}{(n-1)!·(r-1)!}p^{r-1}q^{n-r} - (np)^2$


$V(X) = np\sum^n_{r=1}r\binom{n-1}{r-1}·p^{r-1}q^{n-r} - (np)^2$

 

평균을 구할 때와 겹치는 부분이 많아 한 번에 표시하였습니다.
1번째 식에서 Combination공식으로 변환해주고 p를 분리하였습니다.
2번째 식에서 n을 분리하고 r을 약분했습니다.
3번째 식에서 np를 sigma 밖으로 분리해주었습니다.
4번째 식에서 Combination의 기호 형태로 변환하였습니다.

 

$V(X) = np\sum^n_{R=0}(R+1)\binom{n-1}{R}·p^{R}q^{n-R-1} - (np)^2$


$V(X) = np\left[\sum^n_{R=0}R\binom{n-1}{R}·p^{R}q^{n-R-1} + \binom{n-1}{R}·p^{R}q^{n-R-1}\right] - (np)^2$

 

이제 다시 보기 좋게 변환하기 위해  r-1 = R로 치환합니다.
그리고 R+1을 두 항으로 분리해줍니다.

 

$\sum^n_{R=0}R\binom{n-1}{R}·p^{R}q^{n-R-1} = \sum^n_{r=0}r\binom{n-1}{r}·p^{r}q^{n-r-1} = (n-1)·p$

 

여기서 $r$은 보기 편의를 위해 바꿔주었고 해석하면 이항분포 $B(n-1,p)$를 따르는 확률변수 평균이므로 $(n-1)·p$로 나타낼 수 있습니다.

 

$\sum^n_{R=0}\binom{n-1}{R}·p^{R}q^{n-R-1} = \sum^n_{r=0}\binom{n-1}{r}·p^{r}q^{n-r-1} = 1$

 

평균을 구할 때와 마찬가지로 확률의 합인 1이 나옵니다.

 

따라서 정리한 내용은 다음과 같습니다.

$V(X) = np\left[\sum^n_{R=0}R\binom{n-1}{R}·p^{R}q^{n-R-1} + \binom{n-1}{R}·p^{R}q^{n-R-1}\right] - (np)^2$

 

$V(X) = np\left[(n-1)·p + 1\right] - (np)^2 = np\left[(n-1)·p + 1\right] -(np)^2$


$V(X) = np(1-p) = npq$