主成分分析

539

 

 主成分分析(PCA:Principal Component Analysis)は、相関をもつ多変量データを、互いに直交する少数の合成変数(主成分)に変換して表す多変量解析法です。
 この統計的手法により、データ分散(情報量)をできるだけ多く保持しつつ次元を削減することで、主要な変動パターン(特徴)を抽出できます。

 この記事では、次の概略手順に沿って、主成分分析の方法を解説しています。
①規準化
②相関係数行列の作成
③固有値・固有ベクトルの計算(別掲の 固有値・固有ベクトル の記事参照)
④主成分の選択
⑤因子負荷量の計算
⑥主成分得点の計算

 また、これらの計算を行うExcelファイルも公開しています。

 

<参考記事>
固有値・固有ベクトル

<参考資料>
・細谷克也(2019),”QC検定受検テキスト1級”,日科技連 (サンプルデータ用含む)
・内田治(2019),”QC検定1級 品質管理の手法70ポイント”,日科技連 (サンプルデータ用含む)

・経済企画庁(1999),”新国民生活指標(住む)データ” (サンプルデータ用)
・国税庁(1995),”都道府県別アルコール類の消費量” (サンプルデータ用)
・北京五輪10種競技結果 (サンプルデータ用)

<参考URL>
主成分分析 (サンプルデータ用)
スポーツテストデータ (サンプルデータ用)
Wine (サンプルデータ用)

 

 


 

 


主成分分析Excel

 主成分分析を行うExcelシートです。

 データ領域(C~L列)にデータ(50個まで)を入力して計算ボタンを押すと、固有値と固有ベクトルを計算して因子負荷量と主成分得点を算出し、それらのグラフを表示します。
 (未使用のセルは空白にして下さい)

 データ表示ボタンにより、計算途中に作成される行列データを表示します。

 マクロソースは公開していますので、ご自由にアレンジしてみて下さい。
 なお、特性セルの行と列を手動で拡張すれば、より多くの特性数での計算も行えます。

 revBより、サンプルデータシートからデータを読み込む機能を追加しました(「データ設定」ボタン)。
 データシート内のデータを編集することで、ユーザのデータに対して計算させることができます。

 revC以降、ActiveXに関するMicrosoftのポリシー変更に対応するため、マクロ実行ボタンの表示方法を変更しています。

★このExcelはMicrosoft365で作成していますので、2019以前のバージョンのExcelでは正常に動作しない可能性があるため、ご注意願います。

 

 


2025.8.4 更新 (revD1→revD2)

DL解除コード:a612