f検定とウェルチの検定などを用いて母平均の差の区間推定を行う５つの流れ

2024年1月21日

今回は２つの母集団について扱います。３つ以上の母集団については分散分析の話になり難易度が上がるため、また後日に取り上げていこうと思います。

今回はどのようなことを調べていくのですか？

２つの母集団の母平均の差の区間推定を行います。そのときの区間推定の手法は複数あり、どのような時にどの手法を用いるか？に関して場合分けが生じます。

母平均の差の区間推定…☆についてまとめていたらボリューミーになりました。①母分散が既知のときの☆②母分散の比の区間推定③母分散が未知だが等分散のときの☆④検定の考え方とF検定（等分散検定）⑤母分散が未知で等分散ではないときのウェルチの検定。①→⑤の流れで☆の記事を明日公開します。
— 志田龍太郎 (@nananairu7) January 20, 2024

母平均の差の区間推定にはいろんな種類がある

母分散が等分散か？に関する判断で検定という考えが出てきますので、本記事から検定の話題も取り入れていきます。

信頼係数は一貫して1-εとします。これは検定での応用を考えたときに便利な表現だからです。

母平均の差の区間推定（母分散が既知の場合）

区間推定を行うための手順を復習しておきます。

信頼係数1-εの信頼区間の作り方（『統計学大百科事典仕事で使う公式・定理・ルール113』を参考）
１.母集団のパラメータを用いて標本の統計量の分布を作る（この統計量をどうするか？がかなり大事！）
２.確率1-εとなる統計量の範囲を求める
３.統計量の実現値が入るとして２.の範囲をパラメータについて解くと信頼係数1-εの信頼区間が得られる。

まずは母平均の差の区間推定では最も単純な場合を考えます。それは母分散が既知の場合です。

それはなぜですか？

中心極限定理をすぐに使える形だからです。今回は母平均の差の区間推定を行いたいので、図01の序盤のように母平均の差の最尤推定量を求めることを考えます。母分散が既知でも未知でも、母平均の最尤推定量は標本平均になるイメージを持つと、最終結果は予想しやすいです。

この最尤推定量の出し方については次の章にて解説します。それでは図01をご覧ください。

母平均の差の区間推定（母分散が未知だが等分散の場合）

母平均の差の最尤推定量と母分散の不偏推定量

今度は母分散が未知の場合を扱います。区間推定のためにまずは母平均の差についての推定量（これは最尤推定量とは限らない）を求めていくことになります。

この時って前に似た話題を勉強しましたね。正規分布を例にとって４つに場合分けして内容を整理した覚えがあります。

今回は母分散が未知なので、母分散の推定値は不偏分散になると予想ができます。

それでは図02をご覧ください。

母平均の差は定数となるので、その値をδとおいています。そのため尤度関数はδと母集団Yの母平均を変数にとっています。この方法は『確率統計演習 2 統計』を参考にしました。

結局予想していた通りになっていますね。

先ほどの母分散が既知の場合の母平均の差の最尤推定量については、図02の流れで母分散をそのまま代入すれば、今回と同じ結果が得られます。

母分散の推定量を不偏分散にする理由は実際の区間推定の流れを説明する際に、また解説します。

この不偏分散の分母に-2とついていますが、本当にこの結果が不偏推定量なのか不安なので証明をお願いします。

了解しました。下準備としてカイ２乗分布に従う統計量の復習をお願いします！

母平均の差の区間推定（母分散が未知だが等分散の場合）の解説

それでは準備が済んだので、いよいよ区間推定に移ります。

t分布に従う統計量を作り出す（スチューデント化）を行います。とても技巧的ですので、t分布についての記事をお読みでない方は、まずはこちらをお読みください。

私にはかなり複雑に感じましたが、それでもうまくいったのは、母分散が等分散だからですよね？

その通りです。もしも母分散が等分散と言えないときは、かなりお手上げ状態になります。ここで２つの問題点が生じます。

1.母分散が等分散かどうかの判定はどのように行うのか？
2.母分散が未知で、しかも等分散ではないときに、母平均の区間推定はどのように行なうのか？

確率統計演習 2 統計

編集:国沢清典

口コミを見る

Amazon

楽天市場

Yahooショッピング

メルカリ

ポチップ

『確率統計演習 2 統計』には数多くの推定や検定が収録されています。これらの種類はとても多いですが、本書に収録されているのはアクチュアリー数学での範囲内での推定や検定に限られます。それでも実用には十分な量となっています。

母分散の比の区間推定とF検定（等分散の検定）

母分散の比の区間推定

今までの記事では区間推定をメインにしていたため、検定の話は控えていました。しかし今回はどうしてもF検定が必要になるので、初めての検定としてF検定を紹介します。

F検定に進む前に、まずは母分散の比の区間推定を行います。

理論面ではこれで問題ないですが、F分布表には一般に下側ε点が載っていません。このことが次に登場するF検定（ここでは等分散検定）で大事な意味を持ちます。（『確率統計演習 2 統計』を参考）

エクセルでも使われるF検定（等分散の検定）

ここでは検定の流れを説明します。

「ありそうもないことが起こった時は仮説を疑う」これが検定の基本的な考え方です。（『統計学大百科事典仕事で使う公式・定理・ルール113』を参考）

後から疑うと思われる仮説を帰無仮説といい、それに反する仮説を対立仮説と言います。ありそうもないことがどれくらいの確率か？を判断するときの確率を有意水準といいます。有意水準は通常εで表現します。「ありそうもないことが起こった時」の確率がε以下のときに、帰無仮説を疑い取り消します。そのことを帰無仮説を棄却するといいます。反対に「ありそうもないことが起こった時」の確率がεを上回ったときは、帰無仮説を受容すると表現します。

帰無仮説を棄却する（棄却域を求めていく）ことは、具体的にどのような基準で行われていくのでしょうか。図06をご覧ください。一緒に考えていきましょう。図06の上から３行目に登場する統計量を、検定統計量といいます。今回はF統計量といいます。F統計量の値がどの値に収まるか？で帰無仮説を棄却するかの判断を行います。

母分散の推定量として不偏分散を用いているのはF分布の定義に当てはめていくためですね。

左側の棄却域で、このように変形する理由はF分布表に下側ε点がないことが多いからなのですね。

その通りです。そのためF検定を行う際は、F統計量の値において分子と分母の値がどちらが大きいか？を意識していくことになります。統一のために分子の方を大きいとします。理論面ではなく、実用性を考えた結果なのです。

母平均の差の区間推定（母分散が未知で等分散でない場合）

いよいよウェルチの検定（区間推定のことをウェルチの方法といいます）関連の話になります。非常に難しいですが、一緒に頑張りましょう。

母分散が未知で、しかも等分散でない状況のときに、母平均の差の区間推定をどのようにするか？を勉強します。この内容は多くの参考書には非掲載です。そのためアクチュアリー数学の過去問『2017年度の大問3』を参考に区間推定の流れを構築しました。

まずは母平均の差の推定量を考えます。今回も母分散が未知なので不偏推定量を取ります。計算方法は図02をご参照ください。

今回も統計量Tが従う分布を考えたいので、スチューデント化を試みます。

このように統計量Wを設定しておきます。

図09の☆の形からカイ２乗分布が出てくるとわかるので、素直に式変形をしていきます。しかしこのままではt分布の自由度が出てきませんので、次のように工夫していきます。

このWの従う分布の形からカイ２乗分布が作れれば、統計量Tが従うt分布の自由度が判明することになります。

ここまで来ればもうすぐおしまいです！

t分布の自由度fはどのように計算するのですか？図12の結果だと母分散がわからないので、詰んでしまう気がします。

大丈夫です。対応する推定量（不偏分散）を代入すればOKです。

では結論を書きます。アクチュアリー数学ではこちらを公式として使用すると使いやすいのでおすすめです。

ウェルチの方法を検定に応用するとウェルチの検定になるのですね！

その通りです！とても難しい流れでしたが、何度も繰り返し学習して力をつけていきましょう。

志田龍太郎

東京大学修士→30代セミFIRE元数学教諭(麻布高など指導)/アクチュアリー数学,統計検定１級(2025年に再挑戦)/数検１級→高３・漢検１級→教諭時代に合格/ブログ＋SNS運営/AmazonAssociates連携

2025/01/18

データサイエンティスト検定リテラシーレベルの勉強法と学習の記録

2025/01/01

G検定は合格率は高いが難易度も高いので複数書籍での勉強法がおすすめ

2024/12/23

ITパスポート（情報処理技術者試験）の過去問を網羅する勉強方法

コメント欄コメントをキャンセル

他のおすすめ記事

2025/3/23

データサイエンティスト検定リテラシーレベルの勉強法と学習の記録

2025年3月14日にデータサイエンティスト検定（リテラシーレベル）を受験して8割を超えることができました。ここまでの学習法などをシェアします。 https://twitter.com/nananairu7/status/1900454086794789315 近年注目されているデータサイエンスの名前がついた有名なデータサイエンティスト検定（リテラシーレベル）について学習記録を交えた対策記事になります。対策書として最もオーソドックスな『最短突破データサイエンティスト検定（リテラシーレベル）公式リファレン ...

2025/3/25

G検定は合格率は高いが難易度も高いので複数書籍での勉強法がおすすめ

G検定の概要と学習方法 G検定の試験時間は120分で全て選択式の知識問題で自宅にてオンライン受験になります。受験費用は一般は12000円で学生は5000円になります。G検定はキーワードを覚えておくだけでは解けない問題も多く出題され、理解が重要視される検定です。問われていることは何か？を理解し、どう調べれば答えが見つかるかが分かるレベルに達すると、解ける問題が増えます。ディープラーニング→数理統計や機械学習→人工知能ディープラーニングの箇所が最も頻出で、人工知能になると頻度は少なくなります。法律・倫理の問 ...

2025/3/17

ITパスポート（情報処理技術者試験）の過去問を網羅する勉強方法

ITパスポート試験は情報処理技術者試験のことで、情報系の国家試験です。そのため学習すること自体に価値があります。この試験はITの内容だけでなく、会社に関する幅広い教養を身につけることができ、勉強していて楽しい試験です。情報処理技術者試験→基本情報技術者試験→応用情報技術者試験→（データサイエンス系なら）データベーススペシャリストなどと難易度が上がっていきます。そのため情報処理技術者試験（ITパスポート）はこれらの国家試験の入り口に上がる大事な試験です。企業でもITパスポートを持っている社員には待遇を与 ...

2024/12/14

アクチュアリー数学の公式チェックシート

アクチュアリー数学で必要な公式を過去問をベースに総整理しました。なお公式は『アクチュアリー試験　合格へのストラテジー　数学　第2版』を元にしております。本書はアクチュアリー数学受験のバイブルで受験者は必携の書です。確率 Cの公式負の二項定理積分公式など https://www.muscle-castle.com/actuary-math-workbook-chapter1/ 第１章二項分布、ポアソン分布負の二項分布、ファーストサクセス分布超幾何分布 https://www.muscle-cas ...

2024/12/10

アクチュアリー数学のシミュレーションの過去問を解説

アクチュアリー数学のシミュレーションの過去問を解説します。本章はモデリングの最終章であり、アクチュアリー数学の最終章でもあります。内容は逆関数法・棄却法・合成法・分散減少法の４つです。順に解説していきます。分散減少法では負の相関法と制御編療法を扱います。全体的なおすすめの公式・問題集は『アクチュアリー試験　合格へのストラテジー　数学　第2版』です。お手元に置いて本記事をご覧くだされば学習効率が上がります。逆関数法平成17年度問１（８）標準正規分布標準正規分布最初の問題にして逆関数法の最難関の難問 ...

二項分布の母比率の区間推定で信頼区間を求めるときに精密法でF分布を用いる理由と正規分布を用いた近似法の計算式を丁寧に解説

多変量正規分布の期待値や分散や分散共分散行列から独立性や周辺分布の公式までわかりやすく解説