この記事は、ToBuToRiが統計検定準1級受験まで学習した軌跡を残す記事になります。
のちに統計検定準1級を受験しようかと考えている人が見たときに、学習計画や学習内容の参考になることを目指します。
ToBuToRiの理解を深める意味も込めて、学習内容を定期的にまとめて記事にしたいと思っています。
※記事中の数式は、LaTeXで書いています。
今週学んだのは、
- 確率
です。
それでは、行ってみましょう。
標本空間と事象
統計学や確率論では試行により起こりうる事柄を事象と呼びます。
一方で決して起こらない事象を空事象と呼びます。
様々な全ての事象の集合を標本空間と呼びます。
また、試行一回によりもたらされる事象を根元事象と呼び、根元事象を二つ以上含む事象を複合事象と呼びます。
順列と組み合わせ
\(n\)個のものから\(r\)個のものを順番も気にして並べる事象は順列として考えることが出来て、
$$ \begin{eqnarray} _{n}P_r &=& n(n-1)(n-2) \dots (n-(r-1)) \\ &=& n!/(n-r)! \end{eqnarray} $$
となります。
また、順番を気にしない事象を組み合わせとして考えることが出来て、
$$ \begin{eqnarray} _{n}C_r &=& _{n}P_r/r! \\ &=& n!/r!(n-r)! \end{eqnarray} $$
となります。
事象の演算
事象間の関係を理解するのには、ベン図が役立ちます。
二つの事象\(A\)、\(B\)の関係を考える時、
- 和事象:二つの事象のうち少なくとも一つが起こる事象
- 積事象:二つの事象が同時に起こる事象
- 補事象:事象\(A\)が起こらないという事象
があります。
また、\(A\)と\(B\)に積事象がない場合、排反事象と呼びます。
確率の定義
確率とは、事象の起こりやすさを定量的に示すものです。
ラプラスの定義では、根元事象が全部で\(N\)個あって、それらか、「同程度に確からしく」起こる場合に、事象\(A\)と呼べる根元事象が\(R\)個ある時、事象\(A\)の確率は、
$$ P(A) = R/N $$
と定義されます。
また、頻度説として、実際の試行による頻度から導き出す相対頻度が試行回数を増やして収束した値を確率とする定義もあります。
これはどちらも、不完全さを含む考え方であるため、確率を数学的に構成するため、
- すべての事象\(A\)に対して事象\(A\)の起こる確率は、\(0≦ P(A)≦ 1\)
- 全事象に対して、\(P(\Omega)=1\)
- お互いに排反な事象\(A_1\)、\(A_2\)、\(A_3\)、\(\dots\)に対して、\(P(A_1\cup{A_2}\cup{A_3}\cup\dots)=P(A_1)+P(A_2)+P(A_3)+\dots\)
の三つを公理を設けている。
加法定理
事象\(A\)と事象\(B\)が排反事象であるとすると、公理より、
$$ P(A\cup{B}) = P(A) +P(B) $$
となり、これを加法定理と呼びます。
条件付き確率
事象\(B\)が起こったとわかっている時の事象\(A\)の起こる確率を条件付き確率と呼び、
$$ P(A|B) = \frac{P(A\cap{B})}{P(B)} $$
と定義します。
これを積の形に変形すると、
$$ P(A\cap{B}) = P(B)・P(B|A) $$
となり、乗法定理と呼びます。
独立性
事象\(A\)が起こる確率が事象\(B\)に影響されない時、すなわち、
$$ P(A) = P(A|B) $$
である場合、事象Aと事象Bは独立であると言います。
ベイズの定理
ベイズの定理とは、ある事象の条件となる事象の事前の確率からある事象の条件付き確率を求めるもので、
$$ P(H_i|A) = \frac{P(H_i)・P(A|H_i)}{\sum{P(H_j)・P(A|H_j)}} $$
が成り立ちます。
\(P(H_i)\)は事前確率、\(P(H_i|A)\)は事後確率と呼ばれます。
まとめ
今回は学んだのは、
- 確率
です。
【学習を開始して46日目】
では、また。