会社の歯車として働く日々、
いつか世のためなる商いを。
ToBuToRi
統計検定受験記

【統計準1】学習まとめ2

学習まとめ2

この記事は、ToBuToRiが統計検定準1級受験まで学習した軌跡を残す記事になります。

のちに統計検定準1級を受験しようかと考えている人が見たときに、学習計画や学習内容の参考になることを目指します。

ToBuToRiの理解を深める意味も込めて、学習内容を定期的にまとめて記事にしたいと思っています。

※記事中の数式は、LaTeXで書いています。

今週学んだのは、

  • 確率分布と二つの事象の確率分布

です。

それでは、行ってみましょう。

確率分布

確率分布とは、確率変数の値に対してその確率変数を取る確率の分布です。

確率分布の代表的なものには、

  • 離散型確率分布
    • ポアソン分布
    • 二項分布
    • 幾何分布
    • 一様分布
  • 連続型確率分布
    • 一様分布
    • 正規分布
    • 指数分布

があります。

離散確率分布は確率(質量)関数により表現され、連続型確率分布は確率密度関数により表現されます。

累積分布関数

累積分布関数」とは、確率変数\( X \)が\( x \)以下となる確率の合計で、

$$ F(x) = P(X \leq x) $$

と表す。

離散型確率変数では確率関数の和に

$$ F(x) = \sum_{x’ \leq x} p(x’) $$

なり、

連続型確率変数では確率密度関数の積分に

$$ F(x) = \int^x_{-\infty} f(x’)dx’ $$

なる。

生存関数

生存関数」とは、t時点以降で生きている確率を表す関数で、\( 1 \)から被験者の生存時間を表す確率変数\( T \)の確率分布関数を引いたものになる。

$$ \begin{eqnarray} F(t) &=& P(T < t) = \int^t_0 f(u)du \\ S(t) &=& P(T \leq t) = 1 – F(t) \end{eqnarray} $$

また、「ハザード関数」は、被験者が\( t \)時点まで生存したという条件のもとで、その時間に死亡する確率で、

$$ h(t) = \frac{f(t)}{1-F(t)} = (-logS(t))’ $$

と表します。

二つの事象の確率分布

二つの事象が同時に起こるときの確率分布を扱う場合、

  • 二つの事象が同時に起こる同時分布
  • 同時分布において片方のの事象に着目する周辺分布
  • 片方の事象が起こった時にもう一つの事象が起こる条件付き分布

があります。

離散型確率変数の場合

同時確率関数を

$$ p(x,y) = P(X = x, Y = y) $$

周辺確率関数を

$$ p_X(x) = \sum_y p(x,y) $$

と表します。

条件付き確率関数は、

$$ p_{X|Y}(x|y) = \frac{p(x,y)}{p_Y(y)} $$

と表します。

連続型確率変数の場合

同時確率密度関数を

$$ f(x,y) = \frac{\partial^2}{\partial x\partial y} F(x,y) $$

周辺確率密度関数を

$$ f_X(x) = \int^\infty_{-\infty} f(x,y) dy $$

と表します。

また、条件付き確率密度関数は、

$$ f_{X|Y}(x|y) = \frac{f(x,y)}{f_Y(y)} $$

と表します。

まとめ

今回は学んだのは、

  • 確率分布と二つの事象の確率分布

です。

【学習を開始して11日目】

では、また。