学習

【統計検定1級完全対応】確率分布間の関係性を様々な観点から解説

2024年10月3日

各確率変数のスムーズな繋がりの順に主要な確率分布を紹介していきます。統計検定全級とアクチュアリー数学に完全対応しています。各分布にあるリンクをクリックすると該当分布を詳しく解説する記事に飛びますのでお気軽にご覧ください。複雑にならないように、スムーズに学習しやすいような観点で確率分布を場合分けしていきます。ここの分布の関数や特性値などはリンク先をご参照ください。後日、アクチュアリー数学の公式一覧記事ともリンクさせる予定です。

確率変数が取りうる値で分離する離散型確率分布

確率変数Xが取りうる値が1点〜n点になるにつれてどのような確率分布が生まれてくるのかを整理します。

単位分布

確率変数Xが「x=0に対応する確率が1」を取る以外にはない確率分布を単位分布といいます。

デルタ分布

単位分布をX軸方向に平行移動させた確率分布のことをデルタ分布と言います。

ベルヌーイ分布

単位分布デルタ分布は1点のみを取る確率変数でしたが、x=0の時とx=1の時の2点のみを取る確率分布をベルヌーイ分布といいます。

二項分布

ベルヌーイ試行を複数回行なった際の確率分布を二項分布と言います。高校数学では高校生が最初に触れる確率分布となります。

多項分布

二項分布は2点のみを取る確率分布でしたが、一般にn点を取る確率分布を多項分布と言います。

離散一様分布

n面のサイコロを振る時に考えられる分布を離散一様分布と言います。

一様分布から派生する連続型確率分布

離散一様分布から一様分布にリンクさせて順に連続型確率分布を追っていきます。

連続一様分布

連続型確率分布の中で最もシンプルな確率分布が一様分布です。連続一様分布のことを一様分布と略するのが慣例です。離散一様分布において確率変数Xを連続量とした時の確率分布のことを指します。

標準一様分布

一様分布の区間を0から1にしたときの確率分布を標準一様分布と言います。

標準正規分布

一様乱数を正規乱数に変換したときに、正規乱数が従う確率分布を標準正規分布と言います。

正規分布

標準正規分布の期待値と分散を一般化した時の確率分布を正規分布と言います。同一同分布の正規分布に従う2つの確率変数の和と差は独立となります。

対数正規分布

標準正規分布に従う確率変数Xに対して、Y=e^Xと定義する確率変数Yは対数正規分布に従います。対数正規分布は所得の分布になっていると言われています。後述のパレート分布もお金に絡んだ分布です。

カイ2乗分布

標準正規分布からn個の標本を取り出すとき、各標本の2乗和が従う分布をカイ2乗分布と言います。

t分布

標準正規分布カイ2乗分布を組み合わせるとt分布を作ることができます。

コーシー分布

自由度1のt分布コーシー分布と言います。コーシー分布には期待値が存在しません。ちなみに自由度が無限大のt分布標準正規分布となります。

F分布

2つのカイ2乗分布を組み合わせるとF分布が作られます。自由度nのt分布の2乗は自由度(1,n)のF分布になります。

ベータ分布

F分布からベータ分布が現れます。

順序統計量

標準一様分布に従う一様乱数の順序統計量の期待値としてベータ分布が現れます。順序統計量の確率分布から順序統計量の同時分布を定義でき、範囲の分布も求めることができます。

ガンベル分布

極値統計学の分野の1つにガンベル分布があります。指数分布に従うn個の標本を考えた最大統計量から派生した関数の極限を取ることによりガンベル分布が定義されます。

分布関数から確率分布を分類

東京図書
¥4,180 (2024/10/03 08:23時点 | Amazon調べ)

確率分布を構成するためには分布関数から構成していく方法もあります。この分類法は岩沢先生の『リスクを知るための確率・統計入門』にて詳細に解説されたうちの一部になります。この章ではシンプルな分布関数から複雑なものへと展開していきます。

標準べき関数分布

分布関数にx^aの形の単項式を持つ確率分布を標準べき関数分布と言います。Xの範囲は0以上1以下です。

べき関数分布

標準べき関数分布のXの範囲を0以上β以下に拡大したものをべき関数分布と言います。べき関数分布はαとβの2つのパラメータを持ちます。またべき関数分布でαを1とした分布は一様分布になっています。

パレート分布

べき関数分布の逆数の分布をパレート分布と言います。パレート分布も2つのパラメータを持ちますが、べき関数分布パレート分布の第2パラメータの値は互いに逆数の関係であることに注意しましょう。また変数変換によってパレート分布から指数分布が導かれます。

第2種パレート分布

Xをパレート分布に従う確率変数とするとき、Y=X-βで定義される確率変数Yは同じ2つのパラメータを持つような第2種パレート分布に従います。また第2種パレート分布指数分布とも関連があり、2つのパラメータを持つ指数分布の商は第1パラメータが1で第2パラメータが指数分布のパラメータの商の逆数になります。

対数級数分布

分布関数が直接絡むものではなく、確率和1の考えから構成される確率分布を紹介します。対数関数のマクローリン展開の形を利用して、対数級数分布を作成することができます。対数級数分布対数分布とも呼ばれます。

成功回数と失敗回数に起因する確率分布

離散型確率変数において、成功回数や失敗回数に着目した際に二項分布から派生していく確率分布をまとめます。高校数学ではこの考え方の一部を学習することになります。

二項分布

1回の試行が成功する確率をpとおくとき、n回中に成功する回数Xは二項分布に従います。すなわち二項分布とは成功回数に注目した分布です。

ファーストサクセス分布

n回試行を行うとき、X回目で初めて成功するとき、Xはファーストサクセス分布に従います。ファーストサクセス分布統計検定では出題されにくくアクチュアリー数学で出題されることが多いです。

幾何分布

n回試行を行うとき、初めて成功するまでに失敗した回数Xは幾何分布に従います。ファーストサクセス分布と似ていますがXの定義の仕方が異なるので注意が必要です。ファーストサクセス分布に従う確率変数Yと幾何分布に従う確率変数Xに対して、Y=X+1という関係式が成り立ちます。

負の二項分布

n回試行を行うとき、k回目に成功するまでに失敗した回数Xは負の二項分布に従います。離散分布の負の二項分布の連続版がガンマ分布と考えることができます。

無記憶性による確率分布の分類

無記憶性がある確率分布は幾何分布ファーストサクセス分布指数分布のみになります。

証明はこの記事にて解説

幾何分布とファーストサクセス分布の関係

ファーストサクセス分布に従う確率変数Yは幾何分布に従う確率変数Xに対して、Y=X+1という関係式が成り立ちます。

指数分布と幾何分布の関係

幾何分布に従う確率変数Yは指数分布に従う確率変数Xに対して、Y=[X]という関係式が成り立ちます。すなわち離散分布である幾何分布の連続版が指数分布と考えることができます。

イベント発生によって派生する確率分布

著:久保川達也, 著:新井仁之, 著:小林俊行, 著:斎藤毅, 著:吉田朋広
¥3,450 (2024/10/01 14:11時点 | Amazon調べ)

次章のハザード関数と合わせてイベント発生という観点に注目して確率分布を再編集します。説明部分は統計検定1級のバイブル『現代数理統計学の基礎』をベースにまとめました。

ポアソン分布

二項分布において期待値μ=npです。ここでλ=npを一定としてnを無限大にするとき、離散型確率変数Xはイベントの発生回数を表すパラメータλのポアソン分布に従います。すなわち離散分布の二項分布の連続版がポアソン分布と考えられます。

指数分布

ポアソン分布は単位時間でイベントが起きる回数を表す確率分布です。対して指数分布とはイベントが終わってから次のイベントが生じるまでの時間を表す連続型確率分布です。指数分布ポアソン分布と同じ意味でのパラメータλを持ちます。指数分布ポアソン分布の間に成り立つ関係式があります。さらに指数分布順序統計量ともいくつかの関係があります。

標準ラプラス分布

2つの独立な確率変数XとYがそれぞれパラメータ1の指数分布に従うとき、XーYは標準ラプラス分布に従います。

ラプラス分布

ラプラス分布を標準化すると標準ラプラス分布になります。

アーラン分布

指数分布をn回足した分布をアーラン分布と言います。アーラン分布は2つのパラメータを持ち、第1パラメータはnで形状母数と呼ばれ、第2パラメータはλの意味を持つ尺度母数と呼ばれるパラメータです。

ガンマ分布

アーラン分布における形状母数を正数に拡張した分布をガンマ分布と言います。尺度母数の取り方が参考書によって異なるので注意が必要です。またガンマ分布ポアソン分布とも関係性があります。さらに最大統計量との関係もあります。

逆ガンマ分布

Xがガンマ分布に従うとき、Xの逆数が従う確率分布を逆ガンマ分布と言います。逆ガンマ分布はベイズ統計学で活躍します。母分散が未知の場合の正規分布のベイズ共役(正式用語ではないようですが分かりやすいので本記事で用います)が逆ガンマ分布となります。

カイ2乗分布

ガンマ分布において形状母数をn、尺度母数を1/2とする分布は自由度2nのカイ2乗分布に従います。

ハザード関数から派生する確率分布

指数分布

ハザード関数が一定値λの確率分布を指数分布と言います。指数分布は後述するワイブル分布の第1パラメータ(ワイブル分布係数)αが1の場合の分布です。

ワイブル分布

ハザード関数が等比数列型になる確率分布をワイブル分布と言います。別名を最弱リンクモデルとも言われます。ワイブル分布指数分布と互いに変数変換の関係にもあります。

レイリー分布

ワイブル分布においてワイブル分布係数αが2の場合の分布をレイリー分布と言います。レイリー分布は電波の強度を表す分布です。また2つの確率変数が独立に期待値0で分散σ^2の正規分布に従うとき、二乗和の平方根はレイリー分布に従います。

ゴルベンツ分布

ハザード関数が底がeの指数関数になっているときゴルベンツ分布が定義されます。

二項分布と関係がある確率分布

推定や検定で役に立つ二項分布と関係が深い確率分布をまとめました。

二項分布とポアソン分布と正規分布の関係

二項分布においてλ=npの一定としたうえでnを無限大にすると、ポアソン分布になります。また、nを大きくするとき正規分布に従います。

二項分布と超幾何分布の関係

超幾何分布に従う確率変数をXとします。すなわち全体数N個の中で全体の当たりがM個の集団からn個を取ったときにX個とします。M/Nが一定のとき、nを無限大にすると、Xは二項分布に近づきます。

二項分布と離散型確率変数による順序統計量の関係

二項分布から離散型確率変数による順序統計量の分布関数を求めて微分することにより順序統計量の確率関数を求めることができます。

二項分布と負の二項分布と標準一様分布とベータ分布とF分布の関係

二項分布においてk回以上成功する確率は、負の二項分布においてk回成功するまでに失敗した回数がn-k回以下の確率であり、第k順序統計量が成功確率p以下となる確率であり、さらにこれは特定のパラメータにおけるベータ分布F分布に等しくなります。すなわち二項分布と負の二項分布と標準一様分布とベータ分布とF分布は関連し合っていると言えます。

順序統計量と確率分布の関係

標準一様分布と一様分布とベータ分布の関係

標準一様分布の第k順序統計量ベータ分布との絡みがあります。そのため期待値や分散の計算は容易になります。また一様分布の場合は適当な変数変換により標準一様分布に従う変数で表現することによりベータ分布との関係に持ち込むことができます。また第i順序統計量と第j順序統計量の差は第i-j順序統計量となります。

指数分布と最小統計量の関係

Xがパラメータβの指数分布に従うとき、最小統計量はパラメータnβの指数分布に従います。

幾何分布とファーストサクセス分布と最小統計量の関係

Xがパラメータpの幾何分布に従うとき、最小統計量はパラメータ1-q^2の幾何分布に従います。また、Xがパラメータpのファーストサクセス分布に従うとき、最小統計量はパラメータ1-q^2のファーストサクセス分布に従います。

最大統計量と極値分布の関係

極値統計学の分野の1つにガンベル分布があります。指数分布に従うn個の標本を考えた最大統計量から派生した関数の極限を取ることによりガンベル分布などの確率分布が定義されます。

その他の確率分布同士の関係

本章のほとんどの証明はこの記事で解説

ここでは多変量確率分布を除く統計検定1級などの試験で狙われる、あるいは狙われた確率分布に関する内容を取り上げます。

標準一様分布とコーシー分布との関係

2つの標準一様分布の商からコーシー分布が得られます。

一様分布とコーシー分布との関係

Yを-π/2~π/2までの一様分布に従う確率変数とするとき、X=tanYと定義されたXはコーシー分布に従います。

一様分布とロジスティック分布との関係

ロジスティック分布に従う確率変数を用いて標準一様分布が得られます。

二項分布とベータ分布との関係

二項分布の分布関数などを考えることによりベータ分布との関係を得ることができます。

二項分布とF分布との関係

二項分布の分布関数などを考えることによりF分布との関係を得ることができます。

証明はこの記事で解説

ポアソン分布とカイ2乗分布との関係

ポアソン分布の分布関数などを考えることによりカイ2乗分布との関係を得ることができます。

負の二項分布とカイ2乗分布との関係

Xを負の二項分布NB(r,p)に従う確率変数とするとき、Y=2pXとしてpを0に近づけるときYは自由度2rのカイ2乗分布に従います。

カイ2乗分布とベータ分布との関係

2つのパラメータに従うカイ2乗分布から分母が重たい商の形を作ることによりベータ分布が得られます。

ガンマ分布とベータ分布との関係

2つの尺度パラメータが等しいガンマ分布から分母が重たい商の形を作ることによりベータ分布が得られます。

ガンマ分布と正規分布との関係

ガンマ分布の尺度母数を固定して形状母数を無限にすると正規分布が得られます。これは指数分布に従う試行を多くの回数を独立に繰り返すことと考えることができ、正規近似できることに由来します。

ベータ分布と正規分布の関係

ベータ分布に従う確率変数を標準化し、第1パラメータを無限大にすると標準正規分布が得られます。Twitterのフォロワーさんの投稿で知りました。

以下の証明などはこの記事で解説

t分布とベータ分布との関係

t分布ベータ分布は互いに変数変換の関係を持ちます。

ポアソン分布とガンマ分布と負の二項分布との関係

ポアソン分布をλについてガンマ分布の重みで混合すると負の二項分布を得ます。

正規分布とガンマ分布とt分布との関係

正規分布をθについてガンマ分布の重みで混合するとt分布を得ます。

多変量の確率分布

一般的に難易度が高い多変量の確率分布を終盤にまとめます。

多項分布

二項分布をn変量に拡張した分布が多項分布です。

ディリクレ分布

ベータ分布をn変量に拡張した分布がディリクレ分布です。そのためディリクレ分布ベータ分布の間に成り立つ関係式が存在します。ディリクレ分布は拡張されたベータ関数をルーツに持つので、多重積分の計算で効力を発揮します。ディリクレ分布多項分布の共役事前分布になります。つまり事前確率分布と事後確率分布が同じ関数形になります。すなわちディリクレ分布多項分布の積はディリクレ分布になります。

多変量正規分布

正規分布の確率密度関数において各パラメータなどを行列、ベクトル表示したものを多変量正規分布と言います。

多変量標準正規分布

多変量正規分布の期待値ベクトルを0ベクトル、分散共分散行列を単位行列とするとき、多変量標準正規分布が導かれます。

ベイズ統計からの確率分布の分類

最後に共役事前分布などに関連したベイズ統計学に登場する主要な分布をまとめます。共役事前分布とは、事前確率分布と事後確率分布が同じ関数形になる分布を指します。

ベータ二項モデル

θの事前分布としてベータ分布を用います。xを与えた時のθの分布を二項分布とするとき、θの事後分布はべータ二項モデル(ベルヌーイ・ベータモデル)と言います。すなわち二項分布のベイズ共役はベータ分布になります。この関係は二項分布ベルヌーイ分布でも成立します。

ディリクレ多項モデル

θの事前分布としてディリクレ分布を用います。xを与えた時のθの分布を多項分布とするとき、θの事後分布は(あまり呼ばれていませんが)ディリクレ多項モデルと言います。すなわちの多項分布ベイズ共役はディリクレ分布になります。

ガンマポアソンモデル

θの事前分布としてガンマ分布を用います。xを与えた時のθの分布をポアソン分布とするとき、θの事後分布はガンマポアソンモデル(ポアソン・ガンマモデル)と言います。すなわちポアソン分布のベイズ共役はガンマ分布になります。

正規・正規モデル

母分散が既知のとき、期待値θの事前分布として正規分布を用います。xを与えた時のθの分布を正規分布とするとき、θの事後分布は正規・正規モデルと言います。すなわち母分散が既知のとき、正規分布のベイズ共役は正規分布になります。

逆ガンマ正規モデル

母分散が未知のとき、期待値θの事前分布として逆ガンマ分布を用います。xを与えた時のθの分布を正規分布とするとき、θの事後分布は(あまり呼ばれていませんが)逆ガンマ正規モデルと言います。すなわち母分散が未知のとき、正規分布のベイズ共役は逆ガンマ分布になります。

この流れでウィシャート分布などもありますが、統計検定1級やアクチュアリー数学と比べると難易度が高すぎるため、主要な確率分布の紹介はここまでとします。

ベルヌーイ分布二項分布幾何分布負の二項分布ポアソン分布超幾何分布単位分布デルタ分布ファーストサクセス分布対数級数分布標準一様分布一様分布離散一様分布指数分布ラプラス分布標準べき関数分布べき関数分布パレート分布第2種パレート分布アーラン分布ガンマ分布標準正規分布正規分布対数正規分布レイリー分布ワイブル分布カイ2乗分布多項分布ベータ分布ディリクレ分布順序統計量順序統計量の同時分布範囲の分布t分布コーシー分布F分布多変量標準正規分布多変量正規分布ロジスティック分布べータベルヌーイモデルべータ二項モデルガンマポアソンモデル正規正規モデル、逆ガンマ分布、逆ガンマ正規モデル、ゴルベンツ分布ガンベル分布

  • この記事を書いた人
  • 最新記事

志田龍太郎

東京大学修士→30代セミFIRE元数学教諭(麻布高など指導)/アクチュアリー数学,統計検定1級(2024年に再挑戦)/数検1級→高3・漢検1級→教諭時代に合格/ブログ+SNS運営/AmazonAssociates連携

-学習
-, , , ,