この記事は、ToBuToRiが統計検定準1級受験まで学習した軌跡を残す記事になります。
のちに統計検定準1級を受験しようかと考えている人が見たときに、学習計画や学習内容の参考になることを目指します。
ToBuToRiの理解を深める意味も込めて、学習内容を定期的にまとめて記事にしたいと思っています。
※記事中の数式は、LaTeXで書いています。
今週学んだのは、
- 確率分布と二つの事象の確率分布
です。
それでは、行ってみましょう。
確率分布
確率分布とは、確率変数の値に対してその確率変数を取る確率の分布です。
確率分布の代表的なものには、
- 離散型確率分布
- ポアソン分布
- 二項分布
- 幾何分布
- 一様分布
- 連続型確率分布
- 一様分布
- 正規分布
- 指数分布
があります。
離散確率分布は確率(質量)関数により表現され、連続型確率分布は確率密度関数により表現されます。
累積分布関数
「累積分布関数」とは、確率変数\( X \)が\( x \)以下となる確率の合計で、
$$ F(x) = P(X \leq x) $$
と表す。
離散型確率変数では確率関数の和に
$$ F(x) = \sum_{x’ \leq x} p(x’) $$
なり、
連続型確率変数では確率密度関数の積分に
$$ F(x) = \int^x_{-\infty} f(x’)dx’ $$
なる。
生存関数
「生存関数」とは、t時点以降で生きている確率を表す関数で、\( 1 \)から被験者の生存時間を表す確率変数\( T \)の確率分布関数を引いたものになる。
$$ \begin{eqnarray} F(t) &=& P(T < t) = \int^t_0 f(u)du \\ S(t) &=& P(T \leq t) = 1 – F(t) \end{eqnarray} $$
また、「ハザード関数」は、被験者が\( t \)時点まで生存したという条件のもとで、その時間に死亡する確率で、
$$ h(t) = \frac{f(t)}{1-F(t)} = (-logS(t))’ $$
と表します。
二つの事象の確率分布
二つの事象が同時に起こるときの確率分布を扱う場合、
- 二つの事象が同時に起こる同時分布
- 同時分布において片方のの事象に着目する周辺分布
- 片方の事象が起こった時にもう一つの事象が起こる条件付き分布
があります。
離散型確率変数の場合
同時確率関数を
$$ p(x,y) = P(X = x, Y = y) $$
周辺確率関数を
$$ p_X(x) = \sum_y p(x,y) $$
と表します。
条件付き確率関数は、
$$ p_{X|Y}(x|y) = \frac{p(x,y)}{p_Y(y)} $$
と表します。
連続型確率変数の場合
同時確率密度関数を
$$ f(x,y) = \frac{\partial^2}{\partial x\partial y} F(x,y) $$
周辺確率密度関数を
$$ f_X(x) = \int^\infty_{-\infty} f(x,y) dy $$
と表します。
また、条件付き確率密度関数は、
$$ f_{X|Y}(x|y) = \frac{f(x,y)}{f_Y(y)} $$
と表します。
まとめ
今回は学んだのは、
- 確率分布と二つの事象の確率分布
です。
【学習を開始して11日目】
では、また。