徒然weed

アウトプットの場

ゆる~く統計学3.1〜3.3

f:id:shintaro-football7:20191028234754j:plain
統計学もこつこつやってみようということで下の本を参考に自分が初めて触れる内容について勉強したことをざっくりと書いていきます。

日本統計学会公式認定 統計検定1級対応 統計学

日本統計学会公式認定 統計検定1級対応 統計学

  • 作者: 二宮嘉行,大西俊郎,小林景,椎名洋,笛田薫,田中研太郎,岡田謙介,大屋幸輔,廣瀬英雄,折笠秀樹,日本統計学会,竹村彰通,岩崎学
  • 出版社/メーカー: 東京図書
  • 発売日: 2013/04/08
  • メディア: 単行本
  • この商品を含むブログ (5件) を見る
第3章「統計的推定」からやっていきます。

~十分統計量~

十分統計量とはパラメトリックな分布(分布がわかっていて、パラメータがわかりたい場合)において、そのパラメータの推測の際の十分な情報を含んだ統計量のこと。
定義としては
\begin{align}
P(X=x|T(X) = t,\theta)=P(X=x|T(X) = t)
\end{align}
です。
確かに妥当そうです。なぜなら左が\thetaを「真の」パラメータとした「真の」分布、右が統計量だけをもとにして得られる分布として、それらが一致していれば統計量T(x)は十分良い統計量といえるのもうなづけます。

~フィッシャーネイマンの分解定理~

T(x)\thetaの十分統計量であるとき、
\begin{align}
f(x;\theta) = h(x)g(T(x),\theta)
\end{align}
となる関数 h,gが存在する。逆にこの形で書ければT(x)は十分統計量である。

例題
(1)パラメータ\muのベルヌーイ分布の十分統計量と上記のh,gを答えよ。
(2)正規分布において\sum_i x_i\muの十分統計量であることを示せ。

以上簡単に十分統計量について少しまとめてみました。
次回は点推定量の性質(不偏性、一致性、有効性)などについてです。

番外編

以下はいくつかの確率分布についてまとめてみました。

~離散分布~

・超幾何分布
K 個の成功状態をもつ N 個の要素よりなる母集団から n 個の要素を非復元抽出したときに k 個の成功状態が含まれている確率を与える離散確率分布の一種。(引用:超幾何分布 - Wikipedia)
P(X=k)=\frac{{}_K \mathrm{C}_k \times {}_{N-k} \mathrm{C}_{n-k}}{{}_N \mathrm{C}_n}
f:id:shintaro-football7:20191029225854p:plain

~連続分布~

・指数分布
機械が故障してから次に故障するまでの期間や、災害が起こってから次に起こるまでの期間のように、次に何かが起こるまでの期間が従う分布です。ある期間に平均して\lambda(ラムダ)回起こる現象が、次に起こるまでの期間Xが指数分布に従うとき、X=xとなる確率密度関数は次の式で表されます。\lambdaは指数分布のパラメータであり、必ず正の値をとります。(引用:15-1. 指数分布 | 統計学の時間 | 統計WEB)
f:id:shintaro-football7:20191029231630p:plain
f:id:shintaro-football7:20191029231557p:plain
・ガンマ分布
ガンマ分布は,期間\thetaごとに1回くらい起こるランダムな事象が k回起こるまでの時間の分布を表します
f:id:shintaro-football7:20191029232220p:plain
f:id:shintaro-football7:20191029232223p:plain
\chi^2分布
独立に標準正規分布に従う k 個の確率変数 X1, …, Xk をとる。このとき、統計量
f:id:shintaro-football7:20191029233020p:plain
の従う分布のことを自由度 k のカイ二乗分布と呼びます。
f:id:shintaro-football7:20191029232943p:plain


本日のおまけ
"These are not three separate devices."