통계학 - 확률변수와 확률분포

확률변수와 확률분포

확률변수(random variable, X)

  • 실험의 결과(사건)에 실수값을 대응시키고 그 값에 확률을 부여한 것
  • 실험을 마친 후 어떤 결과가 몇 번 발생했는지 이 결과의 수에 확률이 부여된 것

이산 확률변수(discrete random variable)

  • 셀 수 있는 특정한 값들로 구성되거나 일정한 범위로 나타나는 것
  • 독립적으로 발생하는 사건에 대한 확률변수
  • 사건에 대한 실수값에 확률을 부여한 것 → 각 사건의 확률을 적시하는 확률변수를 기준으로 합산하여 계산
  • eg. 동전 던지기, 주사위 던지기, 윳놀이 등과 같이 모두 독립적으로 발생하는 사건에서 이산 확률변수 확인 가능

연속 확률변수(continuous random variable)

  • 연속형이거나 무한한 경우와 같이 셀 수 없는 것
  • 발생하는 각 사건을 단일한 독립사건으로 구분하기에는 경우의 수가 너무 많아서 범위로 표현되는 확률변수
  • eg. 시간, 온도, 길이 등과 같이 셀 수 없는 결과를 나타내는 확률변수

확률분포(probability distribution)

  • 확률변수 X의 확률분포 : 확률변수 $X$가 취하는 값 $x_i$와 $X$가 $x_i$를 취할 확률 $p_i$의 대응 관계

확률분포표

  • 확률변수와 확률분포의 관계를 표로 나타낸 것
확률변수 변수 X가 취할 수 있는 모든 값 $X=x_i$ $x_1$ $x_2$ $x_3$ $\cdots$ $x_n$
확률분포 X가 이들 값을 취할 확률 $P(X=x_i)$ $p_1$ $p_2$ $p_3$ $\cdots$ $p_n$

확률함수

  • 확률변수와 확률분포의 관계를 식으로 나타낸 것
  • 확률 P를 가진 어떤 사건이 n회 시행 중 x회 나타날 때, 확률변수 x와 이에 대응되는 P(x)의 관계를 나타낸 함수
  • 조건
    • 표본의 개수가 많아야 함 : 최소 30개 이상
    • 인문/사회 과학 : 표본의 크기가 클수록 전체 모집단에 근접
\[P(X=x_i)=p_i \quad (i=1,2,3,\cdots,n)\]
  • 확률함수의 성질
    1. $0 \leq P(X=x_i) \leq 1$
    2. $p_1 + p_2 + p_3 + \cdots + p_n = 1$
    3. $P(X=x_i ~~ or ~~ X=x_j) = P(X=x_i) + P(X=x_j) \quad (i \neq j)$

사건, 확률변수, 확률, 확률함수의 관계

REF 표본공간, 사건 그리고 확률 | 사용자 필로홍

두 개의 주사위 합의 확률변수와 확률분포 구하기

  • 두 개의 주사위 A, B를 동시에 던질 때
    • $i$ : 주사위 A의 눈
    • $j$ : 주사위 B의 눈
    • ($i, j$) : 결과

표본공간 $S$

sample space

  • 측정 가능한 모든 결과들의 집합
  • 근원사건
\[S = \begin{Bmatrix} (1,1), (1,2), (1,3), (1,4), (1,5), (1,6)\\ (2,1), (2,2), (2,3), (2,4), (2,5), (2,6)\\ \cdots\\ (6,1), (6,2), (6,3), (6,4), (6,5), (6,6) \end{Bmatrix}\]
  • 두 주사위 A,B의 눈의 합
    Image

사건 $E$

event

  • 특정 조건이 발생하는 발생하는 경우
  • 표본공간의 부분집합으로 특정 조건을 만족하는 표본점들의 집합

확률 $P(X)$

probability

  • 특정 사건이 발생하는 비율
\[P(X) = \frac{X\,사건이\,일어나는\,경우의\,수}{전체\,사건의\, 경우의\, 수}\]

eg. 눈의 합이 4인 경우

  • $X=4$인 사건 : $\{(1,2), (2,2), (3,1)\}$ ⇒ 총 3개
  • $X=4$일 확률 : $P(X=4)=\frac{3}{36}$

확률변수 $X$

  • 어떤 결과(사건)에 실수값을 대응시키고 그 값에 확률을 부여한 것
  • 눈의 합 $X$가 취할 수 있는 값 : 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12

확률분포

확률변수 $X$ 2 3 4 5 6 7 8 9 10 11 12
확률 $P(X)$ $\frac{1}{36}$ $\frac{2}{36}$ $\frac{3}{36}$ $\frac{4}{36}$ $\frac{5}{36}$ $\frac{6}{36}$ $\frac{5}{36}$ $\frac{4}{36}$ $\frac{3}{36}$ $\frac{2}{36}$ $\frac{1}{36}$ 1

대응관계 그래프

대응관계 그래프

확률함수 $$

  • 대응관계를 식으로 나타낸 것
    \(p(x=k)=\left\{\begin{matrix} \frac{1}{36}(k-1) \quad (2 \leq k \leq 7) \\ \frac{1}{36}(13-k) \quad (8 \leq k \leq 12) \end{matrix}\right.\)
    또는
    \(P(x=k) = \frac{6-|k-7|}{36} \quad (2 \leq k \leq 12)\)

두 개의 동전을 던져 앞면이 나오는 동전의 개수 X의 확률분포와 확률함수 구하기

  • H : 앞면, T : 뒷면

사건 $E$

  • HH, HT, TH, TT > 총 4가지 사건

확률변수 $X$

: 앞면이 몇 번 나올 것인가를 기준으로 사건 분류

  • HH : 앞면이 2번 발생 → $X=2$
  • HT, TH : 앞면이 1번 발생 → $X=1$
  • TT : 앞면이 없음 → $X=0$
$X$ 2 1 0
$P(X)$ $\frac{1}{4}$ $\frac{2}{4}$ $\frac{1}{4}$ 1

확률 $P(X)$

  • 앞면 2번 : 4번 중 1번 발생 ⇒ $\frac{1}{4}$
  • 앞면 1번 : 4번 중 2번 발생 ⇒ $\frac{1}{2}$

확률함수 $P(X=x)$

  • 확률변수 2 : H가 나올 확률 $\frac{1}{2}$이 2번 동시에 발생하므로 곱하기 ⇒ $\frac{1}{2} \times \frac{1}{2} = \frac{1}{4}$
  • 확률변수 1 : 확률변수가 1인 경우는 각각해서 2번 발생하므로 더하기 ⇒ $\frac{1}{4} + \frac{1}{4} = \frac{1}{2}$
  • 확률변수 0 : T가 나올 확률 $\frac{1}{2}$이 2번 동시 발생하므로 곱하기 ⇒ $\frac{1}{2} \times \frac{1}{2} = \frac{1}{4}$
$E$ $X$ $P(X)$ $P(X=x)$
HH
HT
TH
TT
2
1
0
$\frac{1}{4}$

$\frac{1}{2}$
$P(x=2)=\frac{1}{4}$
$P(x=1)=\frac{1}{2}$
$P(x=0)=\frac{1}{4}$
사건 확률변수 확률 확률함수

동전 던지기의 사건, 확률변수, 확률, 확률함수의 관계

흰 공 3개, 초록 공 4개

  • 공을 하나씩 두 번 꺼낼 때 흰 공이 나오는 개수 $X$
  • 꺼낸 공은 다시 넣지 않는다
  • W:흰 공, G: 초록 공
  1. $X$의 확률분포를 구하라
  2. $P(X \geq1)$을 구하라

사건과 확률변수

  • 흰 공이 나오는 사건의 확률변수 구하기

    E GG GW WG WW
    X 0 1 1 2

    → $X$ = 0, 1, 2 ⇒ 3가지

확률

\[P(X=0) = \frac{_4C_2}{_7C_2}, \; P(X=1) = \frac{_4C_1 \times _3C_1}{_7C_2}, \; P(X=2) = \frac{_2C_2}{_7C_2}\]

REF 경우의 수 - 순열, 조합

확률분포

X 0 1 2
P(X) $\frac{2}{7}$ $\frac{4}{7}$ $\frac{1}{7}$ 1

⇒ 흰 공이 나오는 확률분포 : 흰 공이 한 번 이상 포함된 경우

\[P(X \geq 1) = P(X=1) + P(X=2)\\ \qquad \qquad = \frac{4}{7} + \frac{1}{7} = \frac{5}{7}\]

REF
수학의 정석 확률과 통계