消費者研究法(第28回)


最終更新日: counter: (1999/01/28からの累積)

復習問題:因子分析の直交回転は何のために行うのか

第9章 多変量解析

2 主成分分析と因子分析

1.3 因子分析の処理にあたって注意点


1 因子分析の目的
(a)データを要約して構造を見つける
(b)データ縮約
(c)ほかの多変量解析の前処理
(d)変数選択

2 因子分析の企画
(a)変数間の相関か被験者間の相関か
  Rタイプ、Qタイプ。多くは変数間の相関

(b)変数選択と測定の問題
  基本的に量的尺度。ただし、順序尺度であるSD法の尺度も因子分析する。
  質的レベルを少し入れるときはダミー変数にするが、望ましいことではない。
  質的レベルには別の解析法を使う。たとえば、SPSSにはcategoriesというオプションにPrincals という手法がある。数量化3類もその方法の一つであるが、問題がいくつかある。Categories の Homals は数量化3類と同じ。

(c)サンプル数
  相関係数の信頼区間からして、200程度はほしい。Kline(1994,p73)によると、明確な因子構造をもっている場合は100でもいい。50以下は考えられない。
  変数数との比率についてはいろいろ意見がある。上の条件を満たしているとして、変数が多いので追加する場合の目安と考える。10:1から2:1までの説がある(Kline,1994,p74)。Hair et al.(1998)では最低で変数の5倍であり、10倍以上ならあまり問題がない。
  変数数との関係より因子数との関係が重要という研究もある。因子数の20倍以上であるべきとのこと(Arrindel & Ende,1985 Kline から引用)。
  変数をなるべく減らしてからサンプル数を決める。
  サンプル数は因子負荷量の解釈にも影響する。

3 因子分析の仮定
  重要な因子分析の仮定は統計的というより、概念的なものである。
  正規性、等分散、線形性からの乖離は相関係数に影響が問題な場合だけである。(相関係数は外れ値に敏感であるので、このチェックは必要。マハラノビスの距離など, spss ではregression 目的変数にはダミーでcasenum かなんか入れる。)
  ある程度の多重共線性は望ましいとさえいえる。
(a)相関行列(分散共分散行列)は因子を抽出するような関連があるか?
  偏相関もしくは、anti-image correlation. これが小さいとき。しかしどの程度で小さいといえるかわからない。
  Bartlett test of sphericity が少なくともいくつかの相関係数で有意であるかを検証するものであるが、サンプル数が多い場合、たいてい有意になって無力である。
  MSA(measure of sampling adequacy。spss ではKMO(Kaiser-Meyer-Olkin) measure ) という尺度がある。SPSSやSASで出力される。
 このことは変数にも当てはまるとの指摘。全体のKMOは.80以上であること。ただし、.60以上ならばなんとかなる。個別変数のKMOの低い変数を除くと全体のKMOが改善することがある。
----------------------
.90以上 marvelous
.80 以上 meritorious
.70以上 middling
.60以上 mediocre
.50以上 miserable
.50未満 unacceptable
-----------------------
Kaiser,H.F.(1970) A second generation little Jiffy. Psychometrika,35,401-15.
Kaiser and Rise(1974) Little Jiffy Mark IV. Educational and Psychological Measurement, 34(Spring),111-117.
Cerny,B.A. and Kaiser,H.F, 1977 A study of a measure of sampling adequacy for factor-analytic correlation matrices. Multivariate Behavioral Research, 12, 43-47.
Sharma(1996,p116)では KMO(Kaiser-Meyer-Olkin) measure と言及
全体のKMOは.80以上であること。ただし、.60以上ならばなんとかなる。個別変数のKMOの低い変数を除くと全体のKMOが改善することがある。

 変数の選択そのものは研究者の責任である。
 因子構造に関しては同質と考えられる場合に一緒に分析するが、違っているなら別々に分析。ただし、同質と考えられるかどうかを事後的にチェックするには構造方程式モデル(共分散構造分析)を使う。

4 因子の抽出と全体的適合の評価
(a)(共通)因子分析 vs 主成分分析
(b)抽出する因子の基準
(1)固有値1以上の基準(Kaiser-Guttmanルール)
 固有値1以上の因子を採用する。これについては様々な言及がなされている。
 Hair et al.(1998) 変数が20から50の間なら妥当な数をだす。変数が20以下なら少なすぎる、変数が50以上なら多すぎる。

固有値1以上の説明は Stevens(1996)が一番詳しい。p366-p367
変数の数が30未満で
(共通性が.70以上)または(N> 250 かつ平均共通性.60以上)の場合は
固有値1以上のルールでいい。

その他の場合で N>200 ならスクリー・テストでいいだろう。

いくつかのルールの比較

Zwick,W.R. and Velicer,W.F.(1986) Comparison of five rules for determining the number of components to retain. Psychological Bulletin, 99(3), 432-442.
Cliff,N.R.(1988) The eigenvalues-greater-than-one rule and the reliablity of components. Psychological Bulletin, 103, 276-279.

Cattell(1988,p164)
変数が少ないとき(n<20)のときは切り取りが早すぎるし、変数が多いとき(n>50)のは遅すぎる。

5 因子の解釈
(a)回転
直交回転、斜交回転
基本的にバリマックス回転→プロマックス解

(b)有意な負荷量
負荷量 サンプル数
.30 350
.35 250
.40 200
.45 150
.50 120
.55 100
.60 85
.65 70
.70 60
.75 50
(Hair et al. 1998)

(c)信頼できる因子
Guadagnoli and Velicer(1988)
(1)絶対値 0.60 以上の負荷をもつ変数が4つ以上の因子(サンプル数に関係ない)
(2)低い負荷量(.40)の因子が10以上の成分でサンプル数が150以上
(3)サンプル数が300以上でない場合は、少数の低負荷量変数しかない因子は解釈すべきでない。

追加。.80以上の負荷量の変数が少なくとも3あるときはいい。

6 因子分析の妥当性の確認
7 因子分析結果のほかの分析での利用
  重回帰分析、クラスター分析など。

芝祐順 1979 因子分析法 第2版 東京大学出版会(実際は第2版2刷,1981)
柳井晴夫・繁桝算男・前川眞一・市川雅教 1990 因子分析−その理論と方法− 朝倉書店
柳井晴夫 1994 多変量データ解析法 −理論と応用 朝倉書店
柳井晴夫・高木廣文 1986 多変量解析ハンドブック 現代数学社
Cattell,R.B.(1988) The meaning and strategic use of factor analysis. in Nesselroade,J.R., and Cattell,R.B.(eds.) Handbook of multivariate experimental psychology. 2nd ed. Plenum.
Hair.J.F.Jr., Anderson,R.E.,Tatham.R.L., and Black,W.C. 1998
Multivariate data analysis. 5th ed. Prentice Hall.
Nesselroade,J.R., and Cattell,R.B.(eds.) 1988 Handbook of multivariate experimental psychology. 2nd ed. Plenum.
Sharma,S(1996)Applied multivariate techniques. Wiley
Stevens,J.(1996)Applied multivariate statistics for the social
sciences. 3rd ed. LEA.
Tabachnick,B.G. and Fidell,L.S (1996)
Using multivariate statistics. 3rd ed. Harper Collins



《参考・引用文献》

井上文夫ほか 1995 よりよい社会調査をめざして 創元社(テキストといっている書)
芝祐順 1979 因子分析法 第2版 東京大学出版会(実際は第2版2刷,1981)
田中豊・垂水共之 1995 Windows版統計解析ハンドブック多変量解析 共立出版
柳井晴夫・繁桝算男・前川眞一・市川雅教 1990 因子分析−その理論と方法− 朝倉書店
柳井晴夫 1994 多変量データ解析法 −理論と応用 朝倉書店
柳井晴夫・高木廣文 1986 多変量解析ハンドブック 現代数学社
Cattell,R.B.(1988) The meaning and strategic use of factor analysis. in Nesselroade,J.R., and Cattell,R.B.(eds.) Handbook of multivariate experimental psychology. 2nd ed. Plenum.
Gorsuch,R.L.(1988) Exploratory factor analysis. in Nesselroade,J.R., and Cattell,R.B.(eds.) Handbook of multivariate experimental psychology. 2nd ed. Plenum.
Hair.J.F.Jr., Anderson,R.E.,Tatham.R.L., and Black,W.C. (1998) Multivariate data analysis. 5th ed. Prentice Hall.
Kline,P. (1994) An easy guide to factor analysis. Routledge.
Nesselroade,J.R., and Cattell,R.B.(eds.) (1988) Handbook of multivariate experimental psychology. 2nd ed. Plenum.
Sharma,S(1996)Applied multivariate techniques. Wiley
Stevens,J.(1996)Applied multivariate statistics for the social
sciences. 3rd ed. LEA.
Tabachnick,B.G. and Fidell,L.S (1996) Using multivariate statistics. 3rd ed. Harper Collins


香川大学 経済学部 堀 啓造(home page)