数量化3類と順序尺度項目−馬蹄形問題


堀 啓造(香川大学経済学部)
2003/6/17 開設

Counter: 最終更新日:

ガットマン尺度項目や順序尺度項目を数量化3類にかける2つの軸をプロットすると馬蹄形U字型もしくはベルカーブが生じることが分かっている。

Guttman(1950)の使ったデータ。
V1V2V3V4V5
11111
21111
22111
22211
22221
22222


数量化3類を使って分析した結果。Guttman(1950)はスケーログラムの分析であり,横軸は被験者を並べたものであるが,このグラフと同等である。図は横軸を第1固有値に対応するもの。第1軸。縦軸を第2固有値に対応する第2軸である。変数名はV1_1 がアイテム1の第1カテゴリ(上の表のV1で1と答えたもの),V1_2がアイテム1で第2カテゴリ(上の表のV1で2と答えたもの)の位置を示す。V1_1からV5_2まできれいな2次曲線になっている。



Guttman(1950)はこれを意味のあるものとしてとらえ、完全尺度ならば、(1)最小2乗関数、(2)強度(intensity)を示すものとした。3,4固有値に対応するものとしてclosure, involution として心理的意味を解釈した(Guttman, 1954)。強度はその最小値をとるところが、0点を表し、両端にいくほど、強度が増す。closureはポジティブのなかでよりポジティブなゾーンとポジティブが低いゾーン、および、ネガティブの中でよりネガティブなゾーンとネガティブ度の低いゾーンに分ける。という解釈を行うのであるが、実際には数量化しているのでそのような解釈軸は必要ないであろう。複数の軸が一つの数量化のための補足となっているだけである。

対応分析(correspondence analysis)の世界においてはこれを余分なものとして排除する傾向が強い。実際にこれを排除するプログラムが公開されている(detrend correspondence analysis, Hills が開発した(http://www.okstate.edu/artsci/botany/ordinate/DCA.htm)、また距離行列を分析すれば生じないとするものもあるhttp://www.fsw.leidenuniv.nl/www/w3_data/pioneer/pioneer.htm;Groenen, Commandeur and Meulman,1998)。もちろん、DCAのように無理に加工を加えるのに反対の考えもある(Wartenberg, Ferson, and Rohlf,1987)

また,狭い意味での対応分析では「強度」に対応する軸が必ずでることが確認されている(Hills, 1974; Schriever,1983; van Rijckevorsel,1986 )。

数量化3類または,多重対応分析(Multiple Coordinate Analysis; MCA), HOMALSにおいてこの強度成分が必ずでるとはされていないが,ある条件が揃えば出現する。つまり,順序尺度を構成する因子がある場合である。

駒澤(1982)はGuttman の3成分が3次元立体視では渦巻き状になっていることを示したが、それらがどのような意味を持つかには関心がない。つまり意味のあるものかどうかにも関心がない。

岩坪(1987)は一定の条件で強度の次元が生じることを数理的に示した。そして、(p160)
ただし、一次元構造や間隔尺度をもつデータの場合、第3固有値のもつ意味は違ってくる。強度、クロージュア、インボリューションなどの構造は0点の位置ぎめなど、抽出された一次元ものさしの特徴をより詳細に調べる上役立つものといえよう。したがって第3固有値いかに対応する最適スコアは、それによって全く新しいものさしが構成されたと考えるよりは、むしろ第2固有値による一次元尺度を補強するものと考えた方が自然であると思われる。

MCAにおける馬蹄形が生じないように対処する方法はGreenance(1984)が要領よくまとめている。

 一般的に数量化3類がもとのデータ構造を復元できない場合については大津(1996)にある。大津(2002)も参照のこと。不安定さに触れている。
 逆に馬蹄形が生じることを利用して,順序尺度であることを示そうという例もある(山岡, 2002)。2値データならば,ガットマンの方法を用いるのだが,多段階のデータの順序性を一度に示すことを利用するのである。


人工データによる馬蹄形のチェック

人工データによって馬蹄形の出現を調べる。
作成法は相互に一定の相関(たとえば r=0.6)のデータを200個生成(5×200)する(任意の相関行列を満たす正規乱数生成マクロを使用)。そのデータを各変数ごとに上位から等しい人数ごとに5段階に区切る(rank v1 to v5 /ntile(5) into rv1 to rv5.) 。これで5段階評定のアイテムが5つ作られる。

spssでの例
macro の rancorr.sps をあらかじめ走らせておく。
**************************.
matrix data variables=x1 to x5 .
begin data
1
0.6 1
0.6 0.6 1
0.6 0.6 0.6 1
0.6 0.6 0.6 0.6 1
0.6 0.6 0.6 0.6 0.6 1
end data.
* マクロの実行.
rancorr nvar=5/nsmpl=200/fname=*/strict=no.
*5分割する.
rank col1 to col5 /ntile(5)
into rv1 to rv5.
***************************.

このデータを数量化3類で分析する。  結果は下のとおり。相互の相関が0.7の場合明瞭に放物線がわかる。アイテムカテゴリのプロットよりも個体数量のプロットのほうが明確に放物線であることがわかる。  相互相関が0.4ぐらいまではなんとか放物線が見て取れるが,相互相関が0.3になると放物線であることはわからない。

相関 0.7 の順序尺度データ

相関 0.6 の順序尺度データ

相関 0.5 の順序尺度データ

相関 0.4 の順序尺度データ

相関 0.3 の順序尺度データ


馬蹄形問題への対応

(1)順序尺度は順序尺度として扱う

SPSSのcatpca(カテゴリーデータの主成分分析)においては順序尺度の順序を守る処理ができる(「尺度と重み付けの定義」の最適尺度水準を順序にする)。相互相関が0.6の場合のデータを処理すると次のようになる。オブジェクト数量しか全体図を出力できない。数量化3類の結果と比較してみる。データ(6data.sav)

catpca のオブジェクトのプロットでは放物線でなくなっている。
また,モデルの要約をみれば2次元目は意味のないものであることがはっきり分かる。

モデルの要約
次元Cronbach の
アルファ
説明された分散
合計 (固有値)分散の %
10.8713.29665.926
2-0.9770.56111.227
合計0.9263.85877.153
aCronbach のアルファ合計は、固有値合計に基づいています。

(2)主成分分析または因子分析をする

すべてが順序尺度であるならば主成分分析または因子分析をするというのもよく使われる。極端に順序尺度にこだわる人もいるが,それが杞憂であることがわかる。
 Gifi(1990)では,リッカート尺度のそのまま数値として分析する場合とhomals の結果を比較し,homals によって得られるものは少ないとしている(p434-p440)。
 5段階評定以上ならあまり問題ではない(萩生・繁桝, 1996)。経験的にもそのようなことが言われている(semnet の発言)。
 2段階評定(二値データ)なら,最近は四分相関(tetrachoric correlation)をとる方法(計算プログラム)を因子分析することが薦められている。
 3段階以上の順序尺度の場合は多分相関係数(polychoric correlation)(計算プログラム)を使う。
mplus, EQS, LISRE などの共分散構造分析のソフトは四分相関,多分相関, さらに順序尺度と間隔尺度の相関を求めることができる。

実際のデータにおいておこること

 実際のデータを処理すると次のようにゆがんだ形になることがある。これはどうしてなるのか。いずれにしても馬蹄形問題も起こっていることを示している。
 このようになるのは
 (1)頻度の違い(端っこの値の頻度に差がある。下の図だと1にくらべて7と答えている人数がはっきり多い (数量化3類,homals,対応分析の問題参照)
 (2)両極反応のように端っこばかり答えるひとがいて,それが端っこをゆがめる。下の図では1と答える人が7と答える率がかなりある。

 (1)(2)を合わせると,1と答える人が少ないのに7と答える率が高いため起こったと考えられる。つまりランダムに1,7と答えている人がいるのではないかという疑いである。そして1と答えるひとにはランダムな率が高くなっている。1と答える人に比べ7と答える人は一般に多くなっている。つまり反応バイアスがある。


[引用文献]

Gifi,A.(1990). Nonlinear multivariate analysis. Wily

Greenacre, M.J. (1984). Theory and applications of correspondence analysis. Academic Press.

Groenen, P. J. F., Commandeur, J. J. F.and Meulman, J. J. (1998). Distance analysis of large data sets of categorical variables using object weights. British Journal of Mathematical & Statistical Psychology. 51, 217-232.

Guttman, L. (1950). The principal component of scalable attitudes. in S. A. Stouffer, L. Guttman, E. A. Suchman, P. F. Lazarsfeld, S.A. Star, and J.A. Clausen Measurement and prediction, 312-361.

Guttman, L. (1954). The principal component of scalable attitudes. in P. F. Lazarsfeld (ed.) Mathematical thinking in the social sciences, 216-257.

萩生田伸子・繁桝算男(1996). 順序付きカテゴリカルデータへの因子分析の適応に関するいくつかの注意点. 心理学研究, 67, 1-8.

林文・山岡和枝 (2002). 調査の実際−不完全なデータから何を読みとるか. 朝倉書店

Hills, M.(1974). Correspondence analysis: A neglected multi-variate method. Journal of the Royal Statistical Society: Series C (Applied Statistics) , 23, 340-345.

岩坪秀一 (1987). 数量化理論の基礎. 朝倉書店

駒澤勉 (1982). 数量化理論とデータ処理. 朝倉書店

駒澤勉・橋口捷久(1988). パソコン数量化分析. 朝倉書店

駒澤勉・橋口捷久・石崎龍二 (1998). 新版パソコン数量化分析. 朝倉書店

大津悦夫(1996). 次元縮約の落し穴. 統計数理研究所共同研究レポート「多変量質的データの構造解析に関する研究」年月統計数理研究所研究代表者柳井晴夫 (新しいところではまだこの論文読めないようです)

大津悦夫(2002). 尺度混在データのための主成分分析.  柳井晴夫ほか編 多変量解析実例ハンドブック 朝倉書店

Schriever, B.F.(1983). Scaling of order dependent categorical variables with correspondence analyisis. International Statistical Review, 51, 225-238.

van Rijckevorsel,J. L. A. (1986). About hourseshoes in multiple correspondence analysis. in W.Gaul and M.Schrader(eds.), Classification as a tool of research, North Holland. 377-388.

van Rijckevorsel,J. L. A. (1987). The application of fuzzy coding and hourseshoes in multiple correspondence analysis. DSWO Press.

Wartenberg, D., Ferson, S., and Rohlf, F. J. (1987). Putting things right: a critique of detrended correspondence analysis. American Naturalist, 129. 434-448.

山岡和枝 (2002). 健康関連QOLに及ぼす性格特性の影響−数量化III類による分析を中心として 柳井晴夫ほか編 多変量解析実例ハンドブック 朝倉書店


駒澤勉『数量化とデータ処理』朝倉書店 1982
西里静彦『質的データの数量化』朝倉書店 1982 p70
Nishisato,S. 1994 Elements of dual scaling. LEA.

Keizo Hori (home page)
Faculty of Economics
Kagawa University

e-mail hori@ec.kagawa-u.ac.jp