この記事は、ToBuToRiが統計検定準1級受験まで学習した軌跡を残す記事になります。
のちに統計検定準1級を受験しようかと考えている人が見たときに、学習計画や学習内容の参考になることを目指します。
ToBuToRiの理解を深める意味も込めて、学習内容を定期的にまとめて記事にしたいと思っています。
※記事中の数式は、LaTeXで書いています。
今週学んだのは、
- 事象と確率
です。
それでは、行ってみましょう。
事象と確率
基本的な記号と用語は下記になります。
- 事象\(A\):\(A\)が起きること
- 余事象\(A^c\):\(A\)が起きないこと
- 積事象\(A \cap B\):\(A\)、\(B\)の両方ともが起きること
- 和事象\(A \cup B\):\(A\)、\(B\)の少なくとも一方が起きること
- 確率\(P(A)\):ある事象\(A\)の起こる確率
※積事象の記号\( \cap \)は「カップ」、和事象の記号\( \cup \)は「キャップ」と読むことがあります
条件付き確率
「条件付き確率」とは、事象\( A \)が起きたという条件のもとで事象\( B \)が起きる確率のことで、
$$ P(B|A) = \frac{P(A \cap B)} {P(A)} $$
と定義します。
ベイズの定理
条件付き確率に関して乗法定理にて式変形すると、
$$ P(A \cap B) = P(A) \times P(B|A) $$
となります。
また、これは事象\( A \)と事象\( B \)の順序を変えても同じなので、
$$ P(A \cap B) = P(B) \times P(A|B) = P(A) \times P(B|A) $$
となり、式変形すると、
$$ P(B|A) = \frac{P(B) \cdot P(A|B)}{P(A)} $$
となり、これを「ベイズの定理」と呼びます。
また、事象\( \boldsymbol{B} \)が排反な複数の事象\( B_i \)からなる場合、
$$ P(B_i|A) = \frac{P(B_i)\cdot P(A|B_i)}{\sum P(B_j)\cdot P(A|B_j)} $$
と展開することができます。(今まで受けてきた統計系の試験では、確率の計算問題はよくこの形式のものが出てる気がします。)
またこれは、「事象\( A \)が起きた後」の事象\( B_i \)の確率であるため、「事後確率」と呼びます。
一方で、\( P(B_i) \)は、「事象\( A \)が起きる前」の事象\( B_i \)の確率であるため、「事前確率」と呼びます。
離散確率変数
ある変数の値を取る確率が存在する変数を「確率変数」と呼びます。
例えば、サイコロの目が1が出る確率が\( \frac{1} {6} \)であることのように、サイコロの目の値がそれにあたります。
サイコロの目のように、飛び飛びの値を取るものを「離散型確率変数」と呼びます。
離散型確率変数\( X \)が取りうる値\( x \)の確率は、
$$ p(x) = P(X = x) $$
と表し、「確率(質量)関数」と呼びます。
ある確率変数の1回の観測で期待される値を「期待値」と呼び、
$$ \mu = E[X] = \sum_x xp(x) $$
となります。
ある確率変数の取りうる値のひろがりを「分散」と呼び、
$$ \begin{eqnarray} \sigma^2 = V[X] &=& E[(X – \mu)^2] = \sum_x (x – \mu)^2p(x) \\ &=& E[X^2] – \mu^2 \end{eqnarray} $$
となります。
連続型確率変数
温度や重さのように連続した値を取る確率変数を「連続型確率変数」と呼びます。
連続型確率変数の場合は、確率関数ではなく「確率密度関数」となり、\( f(x) \)と表します。
期待値と分散は、
$$ \begin{eqnarray} E[X] &=& \int_{-\infty}^{\infty} xf(x)dx \\ V[X] &=& \int_{-\infty}^{\infty} (x – \mu)^2f(x)dx \end{eqnarray} $$
となります。
まとめ
今回は学んだのは、
- 事象と確率
です。
【学習を開始して3日目】
では、また。