SPSS ときど記(161〜170)

SPSSを使っていてトラぶったところや変な出力や裏技表技の便利な使い方を中心に書き留めてみる。何回話題があるかわからですが,時々書きます。(Keizo Hori
最終更新日: (2004/1/9から)

(151)〜(160) ときど記(メニュー)へ  (171)〜(180)

  1. SPSS ときど記(170) 2004/ 2/26 分散分析 2元分散分析(2)下位検定 単純効果 manova 編
  2. SPSS ときど記(169) 2004/ 2/26 分散分析 2元分散分析(1)主効果と交互作用
  3. SPSS ときど記(168) 2004/ 2/18 保存 excel file への保存でファイルが壊れてる
  4. SPSS ときど記(167) 2004/ 2/18 因子分析 Harris-Kaiser(Orthoblique)回転
  5. SPSS ときど記(166) 2004/ 2/15 因子分析 因子数決定法,斜交回転,階層因子分析
  6. SPSS ときど記(165) 2004/ 2/ 3 systat グラフィック編 信頼カーネル
  7. SPSS ときど記(164) 2004/ 2/ 2 systat マニュアル編
  8. SPSS ときど記(163) 2004/ 1/20 SPSS パッチなどのサポートサイト
  9. SPSS ときど記(162) 2004/ 1/19 クロス集計表 catdap02スクリプト
  10. SPSS ときど記(161) 2004/ 1/ 9 SPSS12 spss統計説明書

SPSS ときど記(170) 2004/ 2/26

分散分析 2元分散分析(2)下位検定 単純効果 manova編

岩原(1965)では直交比較を次にしている。これは省略。

(a)全体としてのすなわち性別を無視しての条件差(主効果)の検定

MANOVA SCORE BY A(1,3) B(1,2)
/error within
/DESIGN A
--------------------------------------------
(1)SPSSのマニュアルではエラーの既定値を WITHIN と書いているが、これは交互作用をすべて書いたときであることに注意しよう。(つまり design でなにも指定しないとき)/error within
をかならず入れること。
(2)結果
* * * * * * A n a l y s i s  o f  V a r i a n c e -- design  2 * *
Tests of Significance for SCORE using UNIQUE sums of squares
Source of Variation     SS   DF    MS     F Sig of F

WITHIN CELLS       25.33   12   2.11
A            149.33    2   74.67   35.37   .000
--------------------------------------------------------
とまるめの誤差におさまっている。

(b)男性における条件差の検定

(c)女性における条件差の検定

これも(a)(1)の注意
MANOVA SCORE BY A(1,3) B(1,2)
/error within
/DESIGN A WITHIN B(1) A WITHIN B(2).

同じDESIGN で指定してしまう。
岩原(1965)ではここで、男性だけのときの条件差、女性だけの条件差を求めている。SPSSの方法はあとで紹介する。

* * * * * * A n a l y s i s  o f  V a r i a n c e -- design  3 * *
Tests of Significance for SCORE using UNIQUE sums of squares
Source of Variation     SS   DF    MS     F Sig of F

WITHIN CELLS       25.33   12   2.11
A WITHIN B(1)      216.89    2  108.44   51.37   .000
A WITHIN B(2)       46.22    2   23.11   10.95   .002
----------------------------------------------------------------------

(g)条件差を無視した性差 (先に処理した)

(d)条件1の性差

(e)条件2の性差

(f)条件3の性差 (岩原1965ではそれぞれ、条件ABCとなる)
----------------------------------------------
MANOVA SCORE BY A(1,3) B(1,2)
/error within
/DESIGN B WITHIN A(1) B WITHIN A(2) B WITHIN A(3)
/DESIGN B.

----------------------------------------------
(1)最初に /error within を指定しておくとあとのDESIGN まで有効。
* * * * * * A n a l y s i s  o f  V a r i a n c e -- design  4 * *
Tests of Significance for SCORE using UNIQUE sums of squares
Source of Variation     SS   DF    MS     F Sig of F

WITHIN CELLS       25.33   12   2.11
B             5.56    1   5.56   2.63   .131

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
* * * * * * A n a l y s i s  o f  V a r i a n c e -- design  5 * *
Tests of Significance for SCORE using UNIQUE sums of squares
Source of Variation     SS   DF    MS     F Sig of F

WITHIN CELLS       25.33   12   2.11
B WITHIN A(1)       32.67    1   32.67   15.47   .002
B WITHIN A(2)       32.67    1   32.67   15.47   .002
B WITHIN A(3)       54.00    1   54.00   25.58   .000
------------------------------------------------------------
岩原(1965)と少し数値が違うが、まるめの誤差が入っている。

(h)以上をまとめて命令すればよい。
----------------------------------------------------
MANOVA SCORE BY A(1,3) B(1,2)
/error within
/DESIGN
/DESIGN A
/error within
/DESIGN A WITHIN B(1) A WITHIN B(2)
/DESIGN B
/DESIGN B WITHIN A(1) B WITHIN A(2) B WITHIN A(3).

-----------------------------------------------------


メニューへ  トップへ (171)へ


SPSS ときど記(169) 2004/ 2/26

分散分析 2元分散分析(1)主効果と交互作用

95/09/19 にnifty のフォーラムに書いたものを多少修正している

one way については説明するまでもないだろう。これは飛ばして、2元分散分析の処理の仕方を説明しよう。このレベルの処理も基礎としてつけておく必要がある。

岩原信九郎『教育と心理のための推計学』日本文化科学社
p274の例題1である。

ある実験において3つの条件の差、男女の性別および両者の相互作用を同時に分析する。男女各9人を無作為に選び、各条件に3人ずつを割り当てて測定している。

SPSSで処理する。

(a)ANOVAの場合。

------------------------------------------------------
TITLE 岩原 P275 23章例
SUBTITLE 2要因の場合の代表値間の有意差 平均
* '細胞の大きさが同じで2以上の場合'.
DATA LIST FREE/SUB A B SCORE.
BEGIN DATA
1 1 1 7
2 1 1 10
3 1 1 12
4 2 1 15
5 2 1 14
6 2 1 16
7 3 1 2
8 3 1 3
9 3 1 4
11 1 2 5
12 1 2 6
13 1 2 4
14 2 2 10
15 2 2 12
16 2 2 9
17 3 2 10
18 3 2 9
19 3 2 8
END DATA.
VAR LABELS
A '条件差'/
B '性差'
.
VALUE LABELS
B 1 '男' 2 '女'.
ANOVA SCORE BY A(1,3) B(1,2)/method=hierarchical/STATISTICS=mean.
---------------------------------------------------------
(1)method はhierarchical か experimental。 既定値の unique は岩原(1965)
の分析結果と異なる。
(2)statistics=mean は平均値出力。

セル平均値(b)
条件差性差SCORE
平均値度数
1.009.66673
5.00003
合計7.33336
2.0015.00003
10.33333
合計12.66676
3.003.00003
9.00003
合計6.00006
合計9.22229
8.11119
合計8.6667(a)18
a全平均
b条件差, 性差 による SCORE

分散分析表(a)
階層的な方法
平方和自由度平均平方F 値有意確率
SCORE主効果(結合された)154.889351.6324.4560.000
条件差149.333274.66735.3680.000
性差5.55615.5562.6320.131
2 次交互作用条件差 * 性差113.778256.88926.9470.000
モデル268.667553.73325.4530.000
残差25.333122.111
合計2941717.294
a条件差, 性差 による SCORE
値は岩原と微妙に違うが丸めの誤差の範囲内におさまっているだろう。

(b)MANOVAの場合

------------------------------------
MANOVA SCORE BY A(1,3) B(1,2)
/DESIGN
.
-------------------------------------
(1)簡単な記述した。あとのために /design も入れておく。

* * * * * * A n a l y s i s  o f  V a r i a n c e -- design  1 * *
*

Tests of Significance for SCORE using UNIQUE sums of squares
Source of Variation     SS   DF    MS     F Sig of F

WITHIN CELLS       25.33   12   2.11
A            149.33    2   74.67   35.37   .000
B             5.56    1   5.56   2.63   .131
A BY B          113.78    2   56.89   26.95   .000

(Model)         268.67    5   53.73   25.45   .000
(Total)         294.00   17   17.29

R-Squared =      .914
Adjusted R-Squared = .878
----------------------------------------------------------------
manova のほうが出力がシンプルでわかりやすい。

(c)GLM の場合

glm SCORE BY A B
/DESIGN


被験者間効果の検定
従属変数: SCORE
ソースタイプ III 平方和自由度平均平方F 値有意確率
修正モデル268.667 553.733 25.453 0.000
切片1352.000 11352.000 640.421 0.000
A149.333 274.667 35.368 0.000
B5.556 15.556 2.632 0.131
A * B113.778 256.889 26.947 0.000
誤差25.333 122.111
総和1646.000 18
修正総和294.000 17
aR2乗 = .914 (調整済みR2乗 = .878)
----------------------------------------

(d)unianova

unianova SCORE BY A B
/DESIGN.

結果はglm と同じ。

以上、交互作用と主効果の検定

交互作用と条件差が有意で性別は有意ではなかった。交互作用が有意であるので、細かいチェックが必要となる。そのチェックを岩原(1965)は事細かに行っているのでそれを追跡する。

メニューへ  トップへ (171)へ


SPSS ときど記(168) 2004/ 2/18


保存 excel file への保存でファイルが壊れてる

以前のバージョンにもあって,SPSS社も対応しているはずなのだが,excel ファイルにデータを保存すると,そのファイルが壊れている。開くことはできるのだが,excel の中で変更して,書き込みもうとするとダメなのである。windows 98+excel 2000で起こっている。

メニューへ  トップへ (169)へ

SPSS ときど記(167) 2004/ 2/18

因子分析 Harris-Kaiser(Orthoblique)回転

因子分析の斜交回転のHarris-Kaiser法のvba プログラムを公開した。元は小笠原春彦さんの
ROSEFである。

excel vba program for faccon.exe 忍者ハットリ君のアタッチメントである。忍者ハットリ君のページにおいてあります。

メニューへ  トップへ (168)へ

SPSS ときど記(166) 2004/ 2/15

因子分析 因子数決定法,斜交回転,階層因子分析

「因子数決定法,斜交回転,階層因子分析」という講演の
pptファイル を公開しました。
 既にマクロやスクリプトで公開している,因子数決定法,階層因子分析について解説したものです。斜交回転は説明する本も少ないので少し参考になると思います。
  • SPSS ときど記(132) 2003/03/18 因子分析 拡張因子分析・高次因子分析 extension script
  • SPSS ときど記(155) 2003/11/28 因子分析 因子数決定法3部作
  • SPSS ときど記(109) 2001/ 9/19 因子分析 因子数決定 script

    メニューへ  トップへ (167)へ

    SPSS ときど記(165) 2004/ 2/ 3

    systat グラフィック編 信頼カーネル

    systat とspssを比較して,systat が特によいのはグラフィックである。多様なグラフィックが準備されている。
    http://www.hulinks.co.jp/software/systat/section02_g.html
    に様々なグラフがある。特に注目すべきはしたの方に「統計解析機能」のグラフのように統計機能の中で出力されるものが豊富である点だ。さらに,確率プロットのように統計分析のグラフもある。

    この頁ではよくわからないが,信頼楕円やそのノンパラメトリック版の信頼カーネル(confidence kernel)という図を出すことができる。有名なアヤメのデータを95%信頼のプロットしてみた。このデータは正規分布と考えていいデータなのでそれほど良さはわからないだろうが,雰囲気はわかるだろう。因子分析の因子負荷量の変数群のまとめや因子得点のグルーピングなどにも使えそうだ。

    メニューでもプログラムでも可能である。上の図のプログラムを示すと次のようになる。

    USE iris
    label species /1= "Setsa", 2= "Versicolor",3="Virginica"
    begin
    PLOT petallen * petalwid / GROUP=species ELL=.95 OVERLAY,
    title="信頼楕円" LOC=-2.3IN,0IN LEGEND=NONE,
    COLOR=BLUE,RED,BLACK,
    SYMBOL=4,5,1 FILL=1

    PLOT petallen * petalwid / GROUP=species KERNEL =0.950 OVERLAY,
    title="信頼カーネル" LOC=2.7IN,0IN ,
    COLOR=BLUE,RED,BLACK,
    SYMBOL=4,5,1 FILL=1
    end

    t検定でもグラフをだす。相関行列でも信頼楕円をだす,外れ値のチェックをする部分があるなど,データをよく見るという点では非常によいソフトである。

    しかし,変数ラベルができないことや値ラベルをシステムファイルに保存できないなどといった,調査データの分析には困ったところがある。こういう点ではspssは非常によい。spssなら質問用紙をほぼそのままシステムファイルに残すことができる。
    メニューへ  トップへ (166)へ

    SPSS ときど記(164) 2004/ 2/ 2

    systat マニュアル編

    SYSTAT 10.2 が来てしばらく立っている。最初の使用は試用版モードとなる。すでにダウンロードしてインストールしていた私の場合は,すでに使用期限(30日)がすぎていて使うことができなかった。
    Hulinks 社からの登録メールも1日おいて来た。そのため,一番使ってみたいときに使用できないといういやなものとなった。

    インストールするハードディスクに固有の番号を使って1機械にしか使えなくするらしい。マイクロソフトのoffice も1パソコンにしかインストールできないようにしている。こういうのがハヤリなのか。

    マニュアルであるが,紙でついているのが3冊。pfd の英語版でついてくるのが6冊である。

    Getting Started, Statitics I, Statistics II の3冊が日本語化されている。Statisitcs I,II は統計分析をabc 順に並べたものである。日本語になっている分順序性がわかりにくい。それでもI のほうが多くの統計ソフトについている統計法であり,II はsystat 特有もしくは新しい手法といっていいものが多く並んでいる。

    Getting Started から読み始めるのがいいだろう。1章,2章,4章を読んでおく必要がある。あとは必要に応じて読めばいいだろう。特に,カットand ペーストで分析を試してみるには4章の途中までを読む必要がある。

    英文と日本文を比較すると,英文で説明されていることが日本文ではバッサリと削られていたりする。Iの13章因子分析は,主成分分析と因子分析の前説がまったくありません。I, p327(Statistical Background)〜p335。しかし,すべての章において前説を省いているわけでもありません。systat がspss よりいいなと思う部分なので省略せずに訳して欲しかった。Iの英語版 661頁が日本語版 562頁,IIの英語版711頁が日本語版574頁になっているだいぶ省略されていることがわかる。普通は訳すと増量してしまうものだ。Getting Started の英語版 202頁,日本語版 210頁

    操作法に関してはspssと同等の説明といっていいでしょう。でも操作法の後に例がたくさんあり,どのように利用するか,どのように解釈するかがわかりやすくなってます。spssの場合,いろいろ出力されるけどどう使うのかわからないものがいろいろある。SPSS ときど記(161) 2004/ 1/ 9 SPSS12 spss統計説明書で書いたような本が必要だというわけだ。しかし,systat はこの点に付いての配慮がかなりされている。また,help ファイルの「例」では出力の説明がボタンをクリックすれば読むことができる。もっともspssは出力をクリックすれば説明を読むことができる。両方一緒についていればいい。処理する前に概略を知りたいときはsystat ,処理後知りたいときはspss方式が便利だ。

    訳語で気になるのがいくつかある。まずあまり日本語にしないという方針があるようだ。マトリックス,ad hoc など。spssの場合,訳しすぎとも思える箇所や誤訳といっていい箇所が散見されるが,ま,こういうのも一つの手だろう。

    因子分析において気づいたこと
    因子得点でいいはずだが,因子のスコアとしている。これはマニュアルとは関係ないが,因子得点は主成分分析のときには保存するが,因子分析のときは保存できないそうだ。不定性からそうしたとのこと。

    マニュアルでは「因子負荷量」という言い方をするが,ダイアログでは「ソートローディング」などと一貫性がない。

    oblique rotation を非直交回転と訳している。すでに斜交回転は定訳とおもわれるし,このマニュアルでも別の箇所でoblique (non-orthogonal) rotations とあるので,斜交回転と訳して欲しい。

    同じOblimin の説明(英文 p337)
    For Gamma, specify 0 for moderate correlations,の訳を
    p250 ガンマに0 を指定すると,相関を調整します。
    とある。「中程度の相関」には0を指定します。である。せっかくsystatのいい解説なのに残念。ヘルプでも同じ間違いをしている。

    マニュアルの問題じゃないですが,因子負荷量のプロットのときに原点から線を引くのをやめてほしい。少ない変量のときはまだいいが,多くなるととても見にくい。

    oblimin の時に,print long などの指定をしないと因子構造を出力しない。かなり思い切ってますね。

    訳語で気になったのは,クロス集計表における deviate, standard deviate の訳語。偏差,標準偏差としている。 通常の標準偏差は standard deviation である。standard deviate はspssで standard residual といっているものだ。残差という言い方のほうが一般的だからここは残差といってしまったほうが良かったのではないか。

    pdf ファイルにしおりがついていない。spssはしおりがついていて頁を開くのに便利だ。しかたがないので自分で章のしおりはつけた。

    メニューへ  トップへ (165)へ

    SPSS ときど記(163) 2004/ 1/20

    SPSS パッチなどのサポートサイト

    spss社のパッチファイルなどのサポートをするサイトがある。
    http://support.spss.com/tech/default.asp
    ログインする必要がある。guest でログインする。パスワードもguest.

    12.0.1のパッチがでているというアナウンスがあったので行ってみた。
    patches→SPSS Client & Server Patches->SPSS Base Client Patches
    >Date: January 12, 2004
    となっているので最新版がでたのかなと思ってダウンロード。10分以上かかった。で,パッチできないという。よく読んでみると,12.0->12.0.1 にするという。日本語版は12月にでたのだが,すでに12.0.1である。
    というわけでパッチをあてる必要はない。説明を見るとexcel 関係でまたも問題があったようだ。

    今のバージョンの問題は。
    http://www.spss.co.jp/support/tech_info/spss12j.html

    PS. 2004/01/30
    サポートのサイトに登録申請をしたら,後日spssジャパンから返事があった。日本からは登録できないので, Guestで入ってくれとのこと。

    メニューへ  トップへ (164)へ

    SPSS ときど記(162) 2004/ 1/19

    クロス集計表 catdap02スクリプト

    クロス集計表の有意な変数および多元クロス表をすぐにわかる形で示すのがcatdap02である。これはすでに
    マクロ化しているが,今回スクリプト化した。メニュー方式で指定できるのでだいぶ気軽にcatdap02 を行うことができる。アンケート調査結果を簡単に理解するためには欠かせない。

    aic を求めている。現在の情況からするとBICのほうがいいかもしれない。

    考え方は,ある反応変数に有効な説明変数は何かみつけるものである。説明変数はクロスした方がいいのかどうかの判断をする。読み取りとしてはAICは-2より小さい組合せが有効な変数の組合せとなる。

    数量化理論のように変数の和ではなくクロスの有効性を探るモノである。
    メニューへ  トップへ (163)へ

    SPSS ときど記(161) 2004/ 1/ 9

    SPSS12 spss統計説明書

    spssの出力する統計を説明する本がでた。
    Norusis, M. J. (2003). SPSS12.0 statistical procedures companion. SPSS.
    http://www.spss.com/estore/softwaremenu/prenticehall2.cfm
    目次的なものは上のサイトにアクセスしてください。 http://www.amazon.co.jp/exec/obidos/ASIN/0131096729/qid=1073573048/sr=1-1/ref=sr_1_16_1/249-3932533-4798739
    日本のamazonは在庫切れになってます。米国はそうなっていない。spssジャパンに注文するのがいいのかな。私は,米国amazon.com から手に入れました。

    クロス表と因子分析の章をざっと読んでみた。spssの出力するすべての統計について説明しているわけではない。例えば,クロス表だと調整済み残差などは触れられていない。

    warning, Tips が読み取り方の注意,指標の使い方について説明している。数値例を使った説明もある。以前のspss(spssxといっていたころまでかな)はこのような本があったのだが,久しぶりにでた。私の場合,spssを使っていた理由の一つとなっていた。以前の解説書にくらべれば,小さく,薄くなっている。その分,もの足りなさはあるが,このような解説が必要な人には適切な量ともいえよう。

    学部上級,大学院生向き。研究者でも統計に不慣れな人には役立つであろう。

    できればSASが出しているような個別の説明書も欲しい。

    メニューへ  トップへ (162)へ

    堀 啓造ホームページへ