消費者研究法(第21回)


最終更新日: counter: (1998/12/18からの累積)

復習問題:相関の大きさとその判断を述べよ。

第8章 調査結果の分析

3 定量的データのクロス表−相関係数と偏相関係

散布図(scattergram,scatterplot,scatter diagram)

データが\\data\material\hori にある。相関データ.xls excel をプロットしてみる(text file)。

相関0のプロット(SPSS)

タレントデータを正規化してプロットしてみる。正規化しない場合と比較する。

3.1 相関係数

相関係数を求める。excel で図を書いてみる。

0.0<=|r|<0.2 ほとんど相関がない
0.2<=|r|<0.4 低い(弱い)正もしくは負の相関がある
0.4<=|r|<0.7 正もしくは負の相関がかなりある
0.7<=|r|<1.0 高い(強い)正もしくは負の相関がある

決定係数 r2

相関係数と散布図

3.2 相関係数の有意性の検定

相関係数の区間推定
標本が大きいときは、標本相関係数をz変換した統計量がほぼ正規分布に従うことを利用して信頼区間を求める。


z=tanh-1r=1/2*log((1+r)/(1-r))

excel では atanh 関数があるので z=atanh(r) になります。

   z1-α/2               z1-α/2
z−----------------- <ζ(ゼータ)<z+---------------------
  sqrt(n-3)               sqrt(n-3)


ζ(ゼータ)はギリシャ文字Ζ(ゼータ)の小文字

α=0.05 であれば z1-α/2=1.96

ζ(ゼータ)から母相関ρ(ロー)への変換

ρ=tanh(ζ)=(e2*ζ-1)/(e2*ζ+1)

Excel には tanh 関数がついているのでこれを使う。


相関係数を単純に信じない。プロットしてみる。
入試のように、一定の点数で切ってしまったデータ。
先のデータを上位1/2だけの相関係数にしてみよう。元データを基準に並べ替えて上位2分の1のデータだけで相関係数をとってみると、相関係数はどうなったか?
また、上位約1/3ならどうなるか調べてみよう。


外れ値がデータを相関係数を高める
大きく外れ値になるデータを1つ入れてみると先のデータの相関係数はどうなるか。
直線以外の関係が明確に存在する

3.3 母相関係数の差の検定

これは前回やった。
独立でない場合はどうするか?計算はかなりこみ入ってくる。
Steiger,J.H. 1980 Tests for comparing elements in a correlation matrix. Psychological Bulletin, 87, 245-251

3.4 偏相関

ベクトル表現による理解

2つの変数のデータをそれぞれ1本の長さ1のベクトルで表す。n次元のデータであるが、2つのベクトルしかないときには2次元上に表現することができる。相関係数はベクトルの内積(長さ1なので cosθ)である。つまり、相関係数は(2つの変数を表す)ベクトルの角度の関数として考えることができる。

相関のベクトル表現
相関のベクトル表現2

《参考・引用文献》

井上文夫ほか 1995 よりよい社会調査をめざして 創元社(テキストといっている書)
芝祐順・南風原朝和 1990 行動科学における統計解析法 東京大学出版会
柳井晴夫・岩坪秀一 1976 複雑さに挑む科学−多変量解析入門 講談社ブルーバックス

香川大学 経済学部 堀 啓造(home page)