数量化３類を主成分分析の応用の観点から具体例を通してわかりやすく説明

2024年2月8日

数量化理論は今までで数量化１類の記事を書きました。数量化１類は重回帰分析の発展でした。

数量化２類の記事がありませんが、なぜでしょうか？

数量化２類は判別分析の発展ですが、ダミー変数の内容など数量化１類とほぼ同じなので記事にしなくても良いかなと思いました。

そして今回の数量化３類は主成分分析の発展です。前回の記事で感じた方もいらっしゃると思いますが、主成分分析では目的変数yが存在しません。そのため数量化３類でも目的変数は存在しませんのでご注意ください。

数量化３類の具体例

数量化３類の一般化は難しいので、具体例で全体的に解説します。

数量化３類では左側にサンプルを、右側に変数をとり、◯で表示されたものが生のデータになります。

数量化３類の目標とは一体なのでしょうか。

いくつかありますが、成分１（主成分分析でいう第１主成分）のみで表現するときは、図02のように◯が対角成分に並ぶような配列を数学的に算出するものです。

そのため数量化３類では相関係数を最大にすることをイメージした式変形を行なっていきます。

数量化３類のやり方

数量化３類の成分１の出し方

数量化３類のやり方としては、サンプルyと変数xを設定するところからスタートします。

図03で設定した変数を見やすく並び替えます。

ここではxを小さい順に並び替えています。

この時にxとyの相関係数rの最大化を考えます。相関係数は定数倍しても定数を足しても変わらないため、平均が０になるような制約条件を設けます。またxやyの分散が１になるように適切な変数変換も考えていきます。

ここまで準備ができたら、主成分分析のときのようにラグランジュの未定乗数法を用いていきます。

数量化３類では第１固有値（最大固有値）は１であり、制約条件を満たさないので、第２固有値から用いることに注意しましょう。

なるほど！ここまで来れば図02が作られているのですね。具体的にはxとyそれぞれで値の大きい数字から並び替えれば◯が対角成分付近に並び出す（相関係数が１に近い）状態が完成するわけですね！

その通りです。ただ成分１だけでなく成分２まで必要な場合もあります。その場合の対処法も考えましょう！

数量化３類の成分２の出し方

主成分分析のときのように、成分１と成分２は変数v,wについて無関係という制約条件を設けます。ただし対称行列の性質から固有ベクトル同士が直交することが確認できるので、結局は成分２についても固有値問題を解けば良いことになります。

成分２は第３固有値と、第３固有ベクトルを求めればOKです。

数量化３類の寄与率と累積寄与率

数量化３類にも寄与率の概念があります。これは成分を幾つまで求めれば良いのかの指標になります。第１固有値が除外されていることにご注意ください。

数量化３類では固有値は必ず１以下になるので、成分数の判断は、累積寄与率が80%以上が目安になります。また成分数の最大数は、（変数の個数とサンプル数の小さい方）ー１個になりますのでご注意ください。

数量化３類での成分１や成分２の寄与率が主成分分析のときのようには大きくはならないときがあります。その時は成分２までを採用する習慣があります。

数量化３類と散布図を書く際の注意点

散布図については主成分分析のときと似てますか？

似ています。変数についての散布図とサンプルについての散布図を描くことになりますが注意が必要です。

ただし、主成分分析のときに扱った内容に沿うようにします。すなわち各変数の普遍分散が固有値になるように定数を掛けてから散布図を書くようにします。

これで自由度が高いように見える数量化３類の解析ができるようになりました。しかし実際はかなりの計算量なので、エクセルやpythonやrやspssなどを用いていくことになります。

多変量解析法入門 (ライブラリ新数学大系 E20)

著:永田靖, 著:棟近雅彦

口コミを見る

Amazon

楽天市場

Yahooショッピング

メルカリ

ポチップ

この具体例は本書の内容を参考にさせていただきました。本書には詳しい散布図の具体例まで掲載されております。わかりやすく大変おすすめの多変量解析の教材です。

志田龍太郎

東京大学修士→30代セミFIRE元数学教諭(麻布高など指導)/アクチュアリー数学,統計検定１級(2025年に再挑戦)/数検１級→高３・漢検１級→教諭時代に合格/ブログ＋SNS運営/AmazonAssociates連携

2025/01/18

データサイエンティスト検定リテラシーレベルの勉強法と学習の記録

2025/01/01

G検定は合格率は高いが難易度も高いので複数書籍での勉強法がおすすめ

2024/12/23

ITパスポート（情報処理技術者試験）の過去問を網羅する勉強方法

志田龍太郎の記事をもっと見る

-学習
-多変量解析, 数量化３類, 統計検定, 統計検定１級

コメント欄コメントをキャンセル

他のおすすめ記事

2025/3/23

データサイエンティスト検定リテラシーレベルの勉強法と学習の記録

2025年3月14日にデータサイエンティスト検定（リテラシーレベル）を受験して8割を超えることができました。ここまでの学習法などをシェアします。 https://twitter.com/nananairu7/status/1900454086794789315 近年注目されているデータサイエンスの名前がついた有名なデータサイエンティスト検定（リテラシーレベル）について学習記録を交えた対策記事になります。対策書として最もオーソドックスな『最短突破データサイエンティスト検定（リテラシーレベル）公式リファレン ...

2025/3/25

G検定は合格率は高いが難易度も高いので複数書籍での勉強法がおすすめ

G検定の概要と学習方法 G検定の試験時間は120分で全て選択式の知識問題で自宅にてオンライン受験になります。受験費用は一般は12000円で学生は5000円になります。G検定はキーワードを覚えておくだけでは解けない問題も多く出題され、理解が重要視される検定です。問われていることは何か？を理解し、どう調べれば答えが見つかるかが分かるレベルに達すると、解ける問題が増えます。ディープラーニング→数理統計や機械学習→人工知能ディープラーニングの箇所が最も頻出で、人工知能になると頻度は少なくなります。法律・倫理の問 ...

2025/3/17

ITパスポート（情報処理技術者試験）の過去問を網羅する勉強方法

ITパスポート試験は情報処理技術者試験のことで、情報系の国家試験です。そのため学習すること自体に価値があります。この試験はITの内容だけでなく、会社に関する幅広い教養を身につけることができ、勉強していて楽しい試験です。情報処理技術者試験→基本情報技術者試験→応用情報技術者試験→（データサイエンス系なら）データベーススペシャリストなどと難易度が上がっていきます。そのため情報処理技術者試験（ITパスポート）はこれらの国家試験の入り口に上がる大事な試験です。企業でもITパスポートを持っている社員には待遇を与 ...

2024/12/14

アクチュアリー数学の公式チェックシート

アクチュアリー数学で必要な公式を過去問をベースに総整理しました。なお公式は『アクチュアリー試験　合格へのストラテジー　数学　第2版』を元にしております。本書はアクチュアリー数学受験のバイブルで受験者は必携の書です。確率 Cの公式負の二項定理積分公式など https://www.muscle-castle.com/actuary-math-workbook-chapter1/ 第１章二項分布、ポアソン分布負の二項分布、ファーストサクセス分布超幾何分布 https://www.muscle-cas ...

2024/12/10

アクチュアリー数学のシミュレーションの過去問を解説

アクチュアリー数学のシミュレーションの過去問を解説します。本章はモデリングの最終章であり、アクチュアリー数学の最終章でもあります。内容は逆関数法・棄却法・合成法・分散減少法の４つです。順に解説していきます。分散減少法では負の相関法と制御編療法を扱います。全体的なおすすめの公式・問題集は『アクチュアリー試験　合格へのストラテジー　数学　第2版』です。お手元に置いて本記事をご覧くだされば学習効率が上がります。逆関数法平成17年度問１（８）標準正規分布標準正規分布最初の問題にして逆関数法の最難関の難問 ...

主成分分析での固有値の役割を行列の考えを用いてわかりやすく解説

多次元尺度構成法の非計量MDSと計量MDSの解析方法をわかりやすく解説