일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- BOF
- Kaggle
- 영상처리
- Got
- 파이토치 트랜스포머를 활용한 자연어 처리와 컴퓨터비전 심층학습
- Computer Architecture
- 백준
- pytorch
- MDP
- MATLAB
- Flutter
- llm을 활용 단어장 앱 개발일지
- Image Processing
- system hacking
- PCA
- DART
- ARM
- C++
- Widget
- fastapi를 사용한 파이썬 웹 개발
- rao
- ML
- Stream
- study book
- bloc
- Algorithm
- BFS
- Dreamhack
- FastAPI
- BAEKJOON
- Today
- Total
Bull
[Statistics] 이항분포의 평균과 분산 증명 본문
확률분포와 이항분포의 정의
확률분포
확률분포는 이산확률분포와 연속확률분포로 나뉩니다.
여기서 이항분포는 이산확률분포를 따르니 이산확률분포를 설명하겠습니다.
이산확률분포는 확률 변수 X의 치역이 셀 수 있는 집합인 경우의 확률변수 X를 나타낸 함수입니다.
즉, 모든 확률 변수가 특정한 값을 가질 확률을 나타내는 함수입니다.
이항분포
이항분포는 성공률이 p인 n회의 베르누이 시행에서 성공횟수를 X라 할 때, 확률변수 X의 확률분포입니다.
이항분포는 이산확률분포 중에서 발생결과가 오직 2가지 뿐인 베르누이 시행을 적용한 이산확률분포라고 생각할 수 있습니다.
따라서 이산확률분포의 평균과 분산의 공식을 통해 이항분포의 공식을 유도할 수 있습니다.
이항분포의 평균 증명
확률분포에서 평균은 다음과 같습니다.
$E(X) = \sum_{x=1}^{n}xf(x)$
여기서 f(x)는 확률변수 x에 대한 확률이므로 온전한 생김새를 위해 $x=x_i$,$f(x)=p_i$로 나타내겠습니다.
$E(X) = \sum_{i=1}^{n}x_ip_i$
이항분포의 특정 사건 r에 대한 확률은 다음과 같습니다.
$P(X=r) = \binom{n}{r}p^rq^{n-r}$
이제 이항분포의 공식을 사용하기 위해 확률분포의 공식에 변수를 마지막으로 한 번 더 통일시키겠습니다.
$E(X) = \sum_{r=1}^{n}rP(X=r)$
$E(X) = \sum_{r=1}^{n}r\binom{n}{r}p^rq^{n-r}$
이 상태에서 이항분포의 평균인 $E(X)=np$를 증명하겠습니다.
$E(X) = \sum_{r=1}^{n}r\binom{n}{r}p^rq^{n-r}$
$E(X) = \sum_{r=1}^{n}r\frac{n·(n-1)!}{(n-r)!·r!}p·p^{r-1}q^{n-r}$
우선 $\binom{n}{r}$를 Combination 공식으로 바꿔주었고 n과 p를 하나씩 분리시켰습니다.
$E(X) = np\sum_{r=1}^{n}r\frac{(n-1)!}{(n-r)!·r!}p^{r-1}q^{n-r}$
$E(X) = np\sum_{r=1}^{n}\frac{(n-1)!}{(n-r)!·(r-1)!}p^{r-1}q^{n-r}$
n과 p는 sigma식과 독립적이므로 밖으로 빼 주었습니다
그리고 r은 팩토리얼식으로 약분하였습니다.
$E(X) = np\sum_{r=1}^{n}\binom{n-1}{r-1}p^{r-1}q^{n-r}$
$\sum_{r=1}^{n}\binom{n-1}{r-1}p^{r-1}q^{n-r} = \binom{n-1}{0}p^{0}q^{n-1} + \binom{n-1}{1}p^{1}q^{n-2} + ... + \binom{n-1}{n-1}p^{n-1}q^{0} = 1$
이제 다시 Combination 공식을 이용해 식을 변형하였습니다.
그 다음 1인 이유는 식을 전개하는 것 보다 sigma식을 변형하여 설명하겠습니다.
$n-1=N,r-1= K$로 치환해봅니다.
$\sum_{K=0}^{n}\binom{N}{K}p^{K}q^{N-K} = 1$
이항분포 확률의 모든 합은 1이므로 공식이 성립됩니다.
따라서 이항분포의 평균은 위와 같음을 증명했습니다.
이항분포의 분산 증명
$V(X) = \sum^n_{i=1}{x_i}^2p_i - m^2$
이산확률분포에서 분산은 위와 같이 나타낼 수 있습니다.
$V(X) = \sum^n_{r=1}\binom{n}{r}p^{r}q^{n-r} - (np)^2$
이전 방식과 같이 $n$,$r$과 $p$로 나타내 보았습니다.
$V(X) = \sum^n_{r=1}r^2\frac{n!}{(n-1)!·r!}p·p^{r-1}q^{n-r} - (np)^2$
$V(X) = \sum^n_{r=1}r\frac{n(n-1)!}{(n-1)!·(r-1)!}p·p^{r-1}q^{n-r} - (np)^2$
$V(X) = np\sum^n_{r=1}r\frac{(n-1)!}{(n-1)!·(r-1)!}p^{r-1}q^{n-r} - (np)^2$
$V(X) = np\sum^n_{r=1}r\binom{n-1}{r-1}·p^{r-1}q^{n-r} - (np)^2$
평균을 구할 때와 겹치는 부분이 많아 한 번에 표시하였습니다.
1번째 식에서 Combination공식으로 변환해주고 p를 분리하였습니다.
2번째 식에서 n을 분리하고 r을 약분했습니다.
3번째 식에서 np를 sigma 밖으로 분리해주었습니다.
4번째 식에서 Combination의 기호 형태로 변환하였습니다.
$V(X) = np\sum^n_{R=0}(R+1)\binom{n-1}{R}·p^{R}q^{n-R-1} - (np)^2$
$V(X) = np\left[\sum^n_{R=0}R\binom{n-1}{R}·p^{R}q^{n-R-1} + \binom{n-1}{R}·p^{R}q^{n-R-1}\right] - (np)^2$
이제 다시 보기 좋게 변환하기 위해 r-1 = R로 치환합니다.
그리고 R+1을 두 항으로 분리해줍니다.
$\sum^n_{R=0}R\binom{n-1}{R}·p^{R}q^{n-R-1} = \sum^n_{r=0}r\binom{n-1}{r}·p^{r}q^{n-r-1} = (n-1)·p$
여기서 $r$은 보기 편의를 위해 바꿔주었고 해석하면 이항분포 $B(n-1,p)$를 따르는 확률변수 평균이므로 $(n-1)·p$로 나타낼 수 있습니다.
$\sum^n_{R=0}\binom{n-1}{R}·p^{R}q^{n-R-1} = \sum^n_{r=0}\binom{n-1}{r}·p^{r}q^{n-r-1} = 1$
평균을 구할 때와 마찬가지로 확률의 합인 1이 나옵니다.
따라서 정리한 내용은 다음과 같습니다.
$V(X) = np\left[\sum^n_{R=0}R\binom{n-1}{R}·p^{R}q^{n-R-1} + \binom{n-1}{R}·p^{R}q^{n-R-1}\right] - (np)^2$
$V(X) = np\left[(n-1)·p + 1\right] - (np)^2 = np\left[(n-1)·p + 1\right] -(np)^2$
$V(X) = np(1-p) = npq$
'Math > Statistics' 카테고리의 다른 글
[Statistics] 가설(Hypothesis) | study book (0) | 2024.08.10 |
---|---|
[Statistics] 음이항분포의 평균과 분산 증명 (0) | 2024.05.12 |
[Statistics] 기하분포의 평균과 분산 증명 (0) | 2024.04.10 |