용어 \& 원리 : 확률
우리는 `경우의 수를 집합으로 바라보는 관점'을 통해 확률 용어의 대부분을 공부했습니다. 그렇지만 리마인드하는 느낌으로 다시 한 번 배워봅시다.
사건과 시행
실험이나 관찰에 의하여 일어나는 결과는 확률에서의 사건이라고 합니다. 같은 조건에서 여러 번 반복할 수 있고, 그 결과가 우연에 의하여 결정되는 실험이나 관찰을 확률에서의 시행이라고 합니다.표본공간
반복할 수 있는 실험이나 관찰에 의하여 일어날 수 있는 모든 각각의 결과들을 원소로 하는 집합을 표본공간이라 합니다.1이는 우리가 앞서 배운 전사건과 동일한 개념입니다. 표본공간의 이름을 지을 때에는 표본공간의 영문 명칭인 $Sample \; Space$의 앞글자를 따 $S$라 하는 것이 일반적입니다.예를 들어, 주사위를 한 번 던지는 상황을 생각해봅시다. 주사위를 던지면 $1$, $2$, $3$, $4$, $5$, $6$이 나올 수 있으므로 $S = \{1,\:2,\:3,\:4,\:5,\:6\}$라 생각할 수 있습니다.
집합으로 정의하는 여러가지 용어들
근원사건, 사건, 공사건
표본공간 $S$의 부분집합을 사건이라 하고, 특히 원소의 개수가 $1$인 사건을 근원사건이라 부르기로 합시다. 사건 $A$의 원소의 개수를 $n\left( A \right) $라 할 때, $n\left( A \right) =0$인 경우, 사건 $A$를 확률에서의 공사건이라 부르기로 합시다.2본문에서는 $A$를 $S$의 부분집합으로 전제하였으므로 $n\left( A \right) =0$이면 $A$를 공사건이라 할 수 있었습니다. $A$가 $S$의 부분집합이 아닌 상황도 일반적으로 설명하기 위해서는 `$n\left( A \cap S \right) =0$인 집합 $A$'를 공사건이라 부르는 것이 자연스럽습니다.앞서 주사위를 한 번 던지는 상황을 표본공간으로 할 때, 각각의 예를 들면 다음과 같습니다.
- $S$의 부분집합인 $B=\{ 1 \}$은 `주사위를 한 번 던질 때 $1$이 나오는 사건'을 의미하며, 동시에 근원사건입니다.
- $S$의 부분집합인 $C=\{ 2,\:4,\:6 \}$은 `주사위를 한 번 던질 때 짝수가 나오는 사건'을 의미합니다.
- $D = \{ 7\}$은 $S$의 부분집합이 아니므로 공사건입니다.
합사건, 곱사건, 여사건
두 사건 $A$와 $B$에 대하여 다음의 세 사건 $C$, $D$, $E$를 생각할 수 있습니다. \[\begin{align*} C = A \cup B,\quad D= A \cap B, \quad E=A^C \end{align*}\] 이때 $C$를 `$A$와 $B$의 확률에서의 합사건', $D$를 `$A$와 $B$의 확률에서의 곱사건', $E$를 `$A$의 확률에서의 여사건'이라 부르기로 합시다. 합사건은 `$A$ 또는 $B$가 일어나는 사건'을 의미하고, 곱사건은 `$A$와 $B$가 동시에 일어나는 사건'을 의미하고, 여사건은 `$A$가 일어나지 않는 사건'을 의미합니다.배반사건
한편 $A \cap B = \emptyset$인 경우, 즉 곱사건이 공사건인 경우, 두 사건 $A$, $B$를 서로 확률에서의 배반사건이라고 합니다. 사건 $A$와 $A$의 여사건 $A^C$는 서로 배반사건입니다.(수학적) 확률
이와 같이 어떤 시행에서 사건 $A$가 일어날 가능성을 수로 나타낸 것을 사건 $A$가 일어날 수학적 확률이라 하고, $\pr A$라 표기합니다.
통계적 확률이란 무엇이고, 수학적 확률과 어떻게 다를까?
통계적 확률이란 실제 시행을 통해 나온 결과로 나타낸 확률을 말합니다. 같은 시행을 $n$번 반복할 때 사건 $A$가 일어난 횟수를 $r_n$이라고 하면, $n$이 한없이 커짐에 따라서 $\dfrac{r_n}{n}$이 일정한 값 $p$에 가까워집니다. 이론적으로는 이 값 $p$를 사건 $A$의 통계적 확률이라 하지만, 현실적으로 $n$을 한없이 크게 만들 수 없기 때문에 $\dfrac{r_n}{n}$을 통계적 확률로 취급하고, $n$이 충분히 커지면 통계적 확률이 수학적 확률에 가까워진다는 것이 알려져 있습니다. 다만 우리는 한동안 통계적 확률에 대해서는 잊고, 수학적 확률만을 다룰 것입니다.5$n$이 충분히 크다고 판단할 수 있는 명확한 기준도 아직 모르고, 시행을 직접 해보면서 계산할 수도 없기 때문에, 부록 이전까지는 수학적 확률만을 이용합시다. 이 둘의 관계에 대해서는 부록에서 다루겠습니다.확률의 성질
어떤 시행에서 표본공간 $S$의 임의의 사건 $A$는 $S$의 부분집합이므로 다음이 성립합니다. \[\begin{align*} 0 \le n\left( A \right) \le n\left( S \right) \end{align*}\] 각 변을 $n\left( S \right) $로 나누면 다음을 얻습니다. \[\begin{align*} 0 = \dfrac{0}{n\left( S \right) }\le \pr A \le \dfrac{n\left( S \right) }{n\left( S \right) }=1 \end{align*}\] 따라서 $0\le \pr A \le 1$입니다. 특히 표본공간 $S$와 공사건 $\emptyset$에 대하여 $\pr S = 1$, $\pr \emptyset = 0$입니다.정리
경우의 수를 다룰 때와 동일하게, 확률 용어들은 집합 용어들에서 `집합'을 `사건'으로 바꾸었을 뿐임을 알 수 있습니다. 따라서 우리는 앞으로 확률을 다룰 때에도 집합의 연산 체계를 그대로 가져다 쓸 수 있습니다.만약 주사위가 정육면체가 아니라 직육면체라면?
\[\begin{align*} S = \{&1_1,\:1_2, \\ &6_1,\:6_2 ,\\ &2_1,\:2_2,\: 2_3,\: 2_4,\: 2_5,\:2_6,\:2_7,\\ &5_1,\:5_2,\: 5_3,\: 5_4,\: 5_5,\:5_6,\:5_7,\\ &3_1,\:3_2,\: 3_3,\: 3_4,\: 3_5,\:3_6,\:3_7,\:\cdots,\:3_{41},\\ &4_1,\:4_2,\: 4_3,\: 4_4,\: 4_5,\:4_6,\:4_7,\:\cdots,\:4_{41}\} \end{align*}\] 그런데 이렇게 표본공간을 설정하는 게 교과서 개념상으로는 맞지만, 그다지 우아한 방법은 아니라는 생각이 들 수 있습니다. 실제로 교과서에서는 다루지 않지만 수학에서는 이를 더 우아하게 나타내는 수학적 표현이 있습니다. 다만 수능에는 그다지 필요하지 않은 개념이므로, 본 책에서는 다루지 않겠습니다.
확률의 덧셈정리
우리는 다음이 성립함을 잘 알고 있습니다. \[\begin{align*} n \left( A \cup B \right) = n\left( A \right) + n\left( B \right) - n\left( A \cap B \right) \end{align*}\] 이 식의 양변을 $n\left( S \right) $로 나누면 다음을 얻으며, 이를 확률의 덧셈정리라고 합니다. 확률의 덧셈정리를 이용하면 합사건의 확률을 구할 수 있습니다.6단, 두 사건 $A$, $B$의 확률뿐만이 아니라 곱사건 $A \cap B$의 확률도 알아야 합니다. \[\begin{align*} \mathrm P\left( A \cup B \right) = \mathrm P\left( A \right) + \mathrm P\left( B \right) - \mathrm P\left( A \cap B \right) \end{align*}\] 특히 두 사건 $A$와 $B$가 배반사건일 경우, $\pn AB=0$이므로 $\mathrm P\left( A \cup B \right) = \mathrm P\left( A \right) + \mathrm P\left( B \right)$입니다.세 개 이상의 사건에 대한 확률의 덧셈정리
경우의 수에서와 마찬가지로, 세 개 이상의 사건에 대해서도 확률의 덧셈정리을 일반화할 수 있습니다. \[\begin{align*} \mathrm P \left( A \cup B \cup C \right) =&\mathrm P\left( A \right) + \mathrm P\left( B \right) + \mathrm P\left( C \right)\\ &- \mathrm P\left( A \cap B \right) - \mathrm P\left( B \cap C \right) - \mathrm P\left( C \cap A \right)\\ &+ \mathrm P\left( A \cap B \cap C \right) \end{align*}\] 경우의 수에서와 마찬가지로, 보통 네 개 이상의 사건에 대해서는 곱사건이 공사건이 아니면 상황이 너무 복잡하여 곱사건이 공사건인 경우만 다룹니다.여사건의 확률
$A \cup {A^C} = S$이고 $A$와 $A^C$는 배반사건이므로 확률의 덧셈정리에 의해 다음이 성립합니다. \[\begin{align*} \mathrm P\left( S \right) &= \mathrm P\left( A \right) + \mathrm P\left( A^C \right) - \mathrm P\left( \emptyset \right)\\ 1 &= \mathrm P\left( A \right) + \mathrm P\left( A^C \right) - 0\\ &\therefore \mathrm P\left( A \right)= 1- \mathrm P\left( A^C \right) \end{align*}\]조건부확률
표본공간 $S$의 두 사건 $A$, $B$에 대하여 확률이 $0$이 아닌 사건 $A$가7이를 수식으로 나타내면 다음과 같습니다. \[\begin{align*} 0 < \pr A \le 1 \end{align*}\] 일어났을 때 사건 $B$가 일어날 확률8조금 더 구체적으로 말하자면, 사건 $A$가 이미 벌어진 상황이라는 전제 하에서 사건 $B$가 일어날 확률을 사건 $A$가 일어났을 때의 사건 $B$의 {조건부확률}이라고 하며, $\pI BA$라 표기하고, 그 값은 다음과 같이 구합니다. \[\begin{align*} \pI BA = \dfrac{n\left( A \cap B \right) }{n\left( A \right) } \end{align*}\] 이 식의 우변의 분자와 분모를 각각 $n\left( S \right) $로 나누면 다음을 얻습니다. \[\begin{align*} \pI BA = \dfrac{n\left( A \cap B \right) }{n\left( A \right) } =\dfrac{\qfrac{n\left( A \cap B \right)}{n\left( S \right) } }{\qfrac*{n\left( A \right) }{n\left( S \right) }} = \dfrac{\pn AB}{\pr A} \end{align*}\]조건부확률의 표기법이 혼동될 수 있습니다. 그럴 때에는 집합의 조건제시법을 떠올리면 됩니다. 조건제시법으로 표현된 집합 $\conset{x}{$x$는 $1$이 아닌 실수}$에서 주인공은 우리가 알고 싶은 그 집합의 원소이며, 이는 $|$의 왼쪽에 놓인 $x$입니다. 한편 $|$의 오른쪽에는 주인공인 $x$가 어떤 조건을 만족시키는지를 나타냅니다. 다시 말하면 다음과 같습니다.
`오른쪽에 주어진 조건'을 만족시키는
왼쪽을 원소로 삼는 집합
조건부확률도 동일하게 해석하면 됩니다. 확률 $\pI BA$에서 주인공은 우리가 확률을 구하고 싶은 그 사건이며, 이는 $|$의 왼쪽에 놓인 $B$입니다. 한편 $|$의 오른쪽에서는 주인공인 $B$가 어떤 조건을 만족시키는지를 나타내며, 그 조건은 $A$가 이미 일어난 상황입니다. 다시 말하면 다음과 같습니다.
` 오른쪽의 사건이 이미 일어났다는 조건'을 만족시키는
왼쪽 사건의 확률
확률의 곱셈정리
조건부확률의 정의에 따르면 확률이 $0$이 아닌 두 사건 $A$, $B$에 대하여9이를 수식으로 나타내면 다음과 같습니다. \[\begin{align*} 0 < &\pr A \le 1\\ 0 < &\pr B \le 1 \end{align*}\] 다음이 성립하며, 이를 확률의 곱셈정리라 합니다. \[\begin{alignat*}{2} \pI AB &= \dfrac{\pn BA}{\pr B}= \dfrac{\pn AB}{\pr B} \qquad &&\therefore \pn AB = \pr{B}\pI AB \\ \pI BA &= \dfrac{\pn AB}{\pr A}&&\therefore \pn AB = \pr{A}\pI BA \end{alignat*}\] 따라서, 확률의 곱셈정리를 이용하면 곱사건의 확률을 구할 수 있습니다.사건의 독립과 종속
확률이 $0$이 아닌 두 사건 $A$, $B$에 대하여 한 사건이 일어나는 것이 다른 사건이 일어날 확률에 아무런 영향을 주지 않을 때, 두 사건 $A$, $B$는 서로 독립이라고 합니다. 또한 두 사건 $A$, $B$가 서로 독립이 아닐 때, 두 사건 $A$, $B$는 서로 종속이라고 합니다.10독립의 정의를 생각하면, 종속은 한 사건이 일어나는 것이 다른 사건이 일어날 확률에 변화를 일으키는 상황임을 알 수 있습니다.독립이기 위한 필요충분조건
확률, 조건부확률, 독립의 정의를 잘 생각해보면, 아무 조건이 주어지지 않은 상태에서 $A$가 일어날 확률은 $\pr A$이고,11이를 조건부확률로 나타내보면 $\pI{A}{S}$라 할 수 있습니다. 이에 대한 자세한 설명은 뒤에서 다룹니다. $B$가 일어났다는 전제 하에 $A$가 일어날 확률은 $\pI AB$이므로, $\pI AB = \pr A$이면 $A$와 $B$가 서로 독립임을 알 수 있습니다. 마찬가지로 $\pI BA = \pr B$이면 $A$와 $B$가 독립임을 알 수 있습니다. 반대로 $A$와 $B$가 서로 독립이면 $\pI AB = \pr A$, $\pI BA = \pr B$입니다.12두 사건 $A$, $B$가 독립이면, 두 사건 $B$와 $A^C$, $A$와 $B^C$, $A^C$와 $B^C$도 각각 독립입니다. 이는 독립의 정의를 이용해 직접 계산해보시기 바랍니다.한편 두 사건 $A$, $B$가 독립이면 확률의 곱셈정리에 의하여 다음이 성립합니다. \[\begin{alignat*}{2} \pn AB &= \pr{B}\pI AB &&= \pr{B}\pr{A} = \pr A \pr B\\ \pn AB &= \pr{A}\pI BA &&= \pr{A}\pr{B} \end{alignat*}\]
반대로 `$\pn AB =\pr{A}\pr{B}$이고 $\pr A>0$'이면 식을 변형하여 $\pI BA = \pr B$가 성립함을 보일 수 있습니다. 같은 방법으로 `$\pn AB =\pr{A}\pr{B}$이고 $\pr B>0$'이면 식을 변형하여 $\pI AB = \pr A$임을 보일 수 있습니다.13변형 과정은 다음과 같습니다. \[\begin{align*} \pI BA &= \dfrac{\pn AB}{\pr A}\\ &= \dfrac{\pr A \pr B}{\pr A}\\ &= \pr B\\ \pI AB &= \dfrac{\pn BA}{\pr B}\\ &= \dfrac{\pn AB}{\pr B}\\ &=\dfrac{\pr A \pr B}{\pr B}\\ &= \pr A \end{align*}\] 따라서 두 사건 $A$, $B$가 독립이기 위한 필요충분조건은 다음과 같습니다. \[\begin{align*} \pn AB = \pr A \pr B \quad\left( \text{단, $\pr A >0$, $\pr B > 0$} \right) \end{align*}\]
독립에서 $\pr A =0$이나 $\pr B = 0$은 왜 제외되나요?
조건부확률의 목적은 특정 조건 유무에 따라 확률이 달라지는지를 판별하는 데에 있습니다. 그런데 확률이 $0$인 사건은 특정 조건의 유무와 관계없이 그 사건이 일어날 확률은 $0$입니다. 따라서 $\pr A = 0$이거나 $\pr B = 0$인 경우에 대해 조건부확률을 논하지 않는 것입니다.독립시행의 확률
주사위나 동전을 여러 번 던지는 경우와 같이 동일한 조건에서 어떤 시행을 반복할 때, 각 시행의 결과가 다른 시행의 결과에 영향을 주지 않는 경우, 즉 각 시행에서 일어나는 사건이 서로 독립이면 이러한 시행을 독립시행이라고 합니다.어떤 시행에서 사건 $A$가 일어날 확률이 $p$, 일어나지 않을 확률이 $1-p=q$일 때, 이 시행을 $n$번 반복하는 독립시행에서 사건 $A$가 $r$번 일어날 확률은 다음과 같습니다. \[\begin{align*} \NCR nr p^r q^{n-r}\quad\left( \text{단, $r$는 $0 \le r \le n$인 정수이다.} \right) \end{align*}\] 특히 $r=0$이면 $\NCR n0 p^0 q^n = q^n$이고, $r=n$이면 $\NCR nn p^n q^0 = p^n$입니다.
한편 $r=0$, $r=1$, $r=2$, $\cdots$, $r=n$인 사건을 각각 $A_r$이라 할 때, $n+1$개의 사건 $A_0$, $A_1$, $A_2$, $\cdots$, $A_n$은 모두 서로 배반사건이고, $A_0 \cup A_1 \cup A_2 \cup \cdots \cup A_n = S$이므로 $\sum_{r=0}^{n}\NCR nr p^r q^{n-r} = 1$입니다.14이는 뒤의 통계 단원에서 배울 `이항분포에서 전체 확률의 합이 $1$이다'와 의미입니다.
- 1. 이는 우리가 앞서 배운 전사건과 동일한 개념입니다.
- 2. 본문에서는 $A$를 $S$의 부분집합으로 전제하였으므로 $n\left( A \right) =0$이면 $A$를 공사건이라 할 수 있었습니다. $A$가 $S$의 부분집합이 아닌 상황도 일반적으로 설명하기 위해서는 `$n\left( A \cap S \right) =0$인 집합 $A$'를 공사건이라 부르는 것이 자연스럽습니다.
- 3. 완벽한 정육면체의 모양인 주사위를 완벽한 평면에 던진다고 가정한다면요.
- 4. 주사위는 일반적으로 마주보는 면의 합이 $7$이 되도록 만들어집니다. 바닥면이 $1$이면 윗면은 $6$, 바닥면이 $2$이면 윗면이 $5$, 바닥면이 $3$이면 윗면은 $4$입니다.
- 5. $n$이 충분히 크다고 판단할 수 있는 명확한 기준도 아직 모르고, 시행을 직접 해보면서 계산할 수도 없기 때문에, 부록 이전까지는 수학적 확률만을 이용합시다.
- 6. 단, 두 사건 $A$, $B$의 확률뿐만이 아니라 곱사건 $A \cap B$의 확률도 알아야 합니다.
- 7. 이를 수식으로 나타내면 다음과 같습니다. \[\begin{align*} 0 < \pr A \le 1 \end{align*}\]
- 8. 조금 더 구체적으로 말하자면, 사건 $A$가 이미 벌어진 상황이라는 전제 하에서 사건 $B$가 일어날 확률
- 9. 이를 수식으로 나타내면 다음과 같습니다. \[\begin{align*} 0 < &\pr A \le 1\\ 0 < &\pr B \le 1 \end{align*}\]
- 10. 독립의 정의를 생각하면, 종속은 한 사건이 일어나는 것이 다른 사건이 일어날 확률에 변화를 일으키는 상황임을 알 수 있습니다.
- 11. 이를 조건부확률로 나타내보면 $\pI{A}{S}$라 할 수 있습니다. 이에 대한 자세한 설명은 뒤에서 다룹니다.
- 12. 두 사건 $A$, $B$가 독립이면, 두 사건 $B$와 $A^C$, $A$와 $B^C$, $A^C$와 $B^C$도 각각 독립입니다. 이는 독립의 정의를 이용해 직접 계산해보시기 바랍니다.
- 13. 변형 과정은 다음과 같습니다. \[\begin{align*} \pI BA &= \dfrac{\pn AB}{\pr A}\\ &= \dfrac{\pr A \pr B}{\pr A}\\ &= \pr B\\ \pI AB &= \dfrac{\pn BA}{\pr B}\\ &= \dfrac{\pn AB}{\pr B}\\ &=\dfrac{\pr A \pr B}{\pr B}\\ &= \pr A \end{align*}\]
- 14. 이는 뒤의 통계 단원에서 배울 `이항분포에서 전체 확률의 합이 $1$이다'와 의미입니다.