対数線形モデル文献案内

Keizo Hori

count:
最終更新日: (2000/8/11から)

日本語

(1)エヴェリット(1980) 質的データの解析 新曜社 5章,6章
英語版は2nd ed.(1992)がでている。入門として,最適。

(2)松田紀之(1988)質的情報の多変量解析 朝倉書店
これは対数線形モデルについての本で、かなり細かいところまで書いてい
ます。(絶版)でしたが,インターネットで復活。必読。

(3)Agresti,A. (渡邊裕之ほか訳)(2003).カテゴリカルデータ解析入門サイエンティスト社
loglinear や logit model はきちんと説明しています。SASコードとデータ
上のホームページでの訂正箇所が紙で挿入されてます。本のなかで修正してほしいですね。

(4)アプトン(1980)調査分類データの解析法 朝倉書店
もいい本です。エヴェリットより詳しい。5章から10章。

(5)坂元慶行(1985)カテゴリカルデータのモデル分析 共立出版
CATDAPというパッケージを開発していてこれを説明しています。3章までが対数線形とからんだ話しです。CATDAPのSPSSマクロ(サブセット)を私のホームページにおいています。

(6)廣津千尋(1982)離散データ解析 教育出版
はオリジナルな点もあるので最初に読むのはおすすめできませんが、余裕
ができたら読むのもいいでしょう。薬学系の例もあるのでその方面の方は
参照するべきでしょう。(対数線形モデルについては後ろのほうだけ)

(7)田中豊垂水共之・脇本和昌(1990)パソコン統計解析ハンドブックV多変量分散分析・線形モデル編 共立出版
8章、9章、10章が対数線形モデルの関係のものとなります。順序データな
ど和書ではあまり扱われていないテーマもあります。前にでていたKochの
もGSKモデルとして扱われています。

(8)田中豊・垂水共之・脇本和昌(1984)パソコン統計解析ハンドブックII多変量解析編 共立出版
18章が対数線形モデルになっています。3元までですが、理解するのにはい
いと思います。

(7)(7200円)と(8)(6500円)とも値段が高いのが欠点ですが、要領よくまとめて
いていい本です。

そのほかに
(9)柳川尭(1986)離散多変量データの解析 共立出版

7章に対数線形モデルがあります。6章がロジスティックモデルになっていま
す。対数線形モデルの説明はあまりたいしたことがないですが、6章のほうは
かなり詳しいですね。



まず、(1)(2)(3)(4)を読んで理解するのがいいと思います。あとは素性の分かっているデータを分析してみる。

英語の本では、初心者用がいくつかでています。そのほうがわかりやすいかもしれませんが、取り合えず日本語のテキストでいいでしょう。


対数線形モデルを日本語で説明しているサイトがほとんどない。結局,松田氏の本がインターネットで公開されているのを読むことになる。

質的データの線型モデル −対数線型モデル・ロジット分析の紹介− 江利川 滋氏 うむ途中で切れてるのかな?  こっちも参照のこと統計手法に関する小文等

spss での使用について。マニアックな説明
SPSS ときど記(126) 2003/01/30 対数線型モデル dummy codingの巻
SPSS ときど記(127) 2003/01/30 対数線型モデル ANOVA codingの巻
次のはノーマルな説明
SPSS ときど記(128) 2003/02/02 対数線型モデル モデル選択
SPSS ときど記(130) 2003/03/05 対数線形モデル loglinear と genlog のモデル指定

英語のサイトでは簡単に状況をつかむのにいいところがある。
Log-Linear, Logit, and Probit Models by G. David Garson
 単語集とQ&Aになっているので即分かりたいという人向けである。

Modelling Categorical Data: Loglinear models and logistic regression

英語

英語の入門書の例
(8)Gilbert,N.(1993) Analyzing tabular table: Loglinear and logistic models for social researchers. UCL Press.
3630円(当時円高)
この本はSPSSの例がでているのでいいかな。

(9)Stevens,J.(1996) Applied multivariate statistics for the social sciences. 3rd ed. LEA.

14章 categorical data analysis: the log linear model.

はSPSSのコマンドや出力があるので、最初の学習としてはいいです。

(9')Stevens,J.(2001) Applied multivariate statistics for the social sciences. 4th ed. LEA.
まだgenlog が入ってません。メニュー式には対応したけど,SPSSは loglinear と hiloglinear です。

(10)Wickens,T.D.(1989) Multiway contingency talbes analysis for the social sciences. LEA
あまり触れられていない問題も扱っているようです。中級でしょうか。大学院の講義をもとにしたテキストです。出版の数年前に留学中に講義を聴かれた方を知ってます。ということは心理学系の講義だったのか。

(11)Agresti,A. (1990) Categorical data analysis. Wiley
home page http://www.stat.ufl.edu/users/aa/
この本は百科事典のように使えるので、カテゴリデータをもっぱら使うならもっているほうがいいと思います。しかし、これを読みすすめるのは辛い。いろんなことを書きすぎている。
(11') Agresti,A. (2002) Categorical data analysis, 2nd edition. Wiley
2nd editionがでました。対数線形モデルは縮小しています。それはrepeated categorical response data や random effect を扱える処理がでてきたからです。

(12)Agresti,A. (1996) An introduction to categorical data analysis. Wiley. $54.95
というのがありました。この段階でもAICが入ってない。loglinear や logit model はきちんと説明しています。SASコードとデータ
渡邊裕之ほか訳(2003).『カテゴリカルデータ解析入門』サイエンティスト社
訳本が出ました。上のホームページでの訂正箇所が紙で挿入されてます。本のなかで修正してほしいですね。

(13)Haberman,S.J. (1978,1979). Analysis of Quantitative data. vol.1 & 2. Academic Press.
も中級・上級の本としては必要なものです。 Harberman の1999講義

(14)Bishop,Y.M.M.,Fienberg,S.E.& Holland,P.W. 1975 Discrete Multivariate Analysis Theory and Practice, MIT Press.
は大抵引用されてますね。統計の研究者なら必要でしょう。

(15)Stokes,M.E.,Davis,C.S., and Koch,G.G. 1995 Categorical data analysis using the SAS system. SAS Institute Inc.
SASユーザでなくても参考になる。新しい分析はやっぱりSASからか。
データおよびプログラムはftp.sas.com のpub/publications の A55320 というファイル。
genmod の説明 catmodの説明


(16)Christensen,R.A.(1990) Log-Linear Models. Springer.
home page http://stat.unm.edu/~fletcher/
専門の本のようですからあってもいいですね。証明入りの数学的にきちんとしようというタイプの本です。しかも、具体例がきっちりと入ってます。ただ、91年以後の本を3冊チェックしてみましたが、引用はされてません。AICはちゃんとあります。特に重回帰分析との関連を考える場合は重要な本でしょうね。GLIMがベースにあるようです。

(17)Christensen,R.A.(1997) Log-Linear Models and logistic regression (2nd ed.). Springer.
これはタイトルは違いますが,上の本の第2版です。大学院レベルと宣言してある章が複数ある。グラフィカルモデルとの関係など,他のアプローチとの比較がある。計算法についても詳しい。データ


(18)Kennedy,J.J. (1992) Analayzing qualitative data: log-linear analysis for behavioral research. 2nd ed. Praeger.

この本はあまり言われてないところまで進んでいて、初心者向けではないと思いますが、こんな分析もあるのだと知るのにはいいかもしれません。

(19)Le,C.T.(1998) Applied categorical data analysis. Wiley.

(20)Andersen,E.B. (1997) Introduction to the statistical analysis of categorical data. Springer.

おっと積んだままだ。

(21)Fienberg,S.E.(1980) The analysis of cross-classified categorical data (2nd ed.). The MIT Press.

絶版だったので外していたのですが,久しぶりに見てみると,やはりいい本なのでいれました。

(22)Tabachnick, B.G., and Fidell, L. S. (2001). Using multivariate statistics. 4th ed. Allyn an Bacon. chap. 7
文献(9)とならんで how to ものとしてよい。spss の使用例がある。spss, SAS, systat の対数線形モデルプログラムにどのような機能があるのか知るのにもよい。
修正 pdf ファイル


==========================================================
同一のデータを複数の論文,本が分析している。手法がいろいろあるので手法の比較やデータ分析の深め方の参考になるだろう。
spssでの処理プログラム例。
*----------------------------------------------
TITLE 'Ries and Smith(1963) 新しい洗剤と古い洗剤とどちらを好む'.
DATA LIST FREE /Soft prev temp brand FREQ.
VAR LABELS
Soft '使用水の硬度'/
prev'以前にMを使用していたか'/
Temp '使用温度'/
brand '新しい洗剤XまたはMを好むか'.
VALUE LABELS
Soft 1 '硬水' 2 '中硬水' 3 '軟水'/
prev 1 '使用なし' 2 '使用あり'/
Temp 1 '低温' 2 '高温'/
brand 1 '洗剤 X' 2 '洗剤 M'.
BEGIN DATA.
1 1 1 1 68
1 1 1 2 42
1 2 1 1 37
1 2 1 2 52
1 1 2 1 42
1 1 2 2 30
1 2 2 1 24
1 2 2 2 43
2 1 1 1 66
2 1 1 2 50
2 2 1 1 47
2 2 1 2 55
2 1 2 1 33
2 1 2 2 23
2 2 2 1 23
2 2 2 2 47
3 1 1 1 63
3 1 1 2 53
3 2 1 1 57
3 2 1 2 49
3 1 2 1 29
3 1 2 2 27
3 2 2 1 19
3 2 2 2 29
END DATA.
weight by freq.
* 偏連関分析と変数減少法のためのコマンド.
HILOGLINEAR
soft(1 3) prev(1 2) temp(1 2) brand(1 2) /METHOD=BACKWARD
/CRITERIA MAXSTEPS(10) P(.05) ITERATION(20) DELTA(.5)
/PRINT=ASSOCIATION
/DESIGN .
*---------------------------------------------------.

文献を挙げると次のようになる。
出版順
コックス(1980,p36-40) 原本1970
Goodman(1978,p145-171) 初出1971
Bishop et al.(1975,p142-146,p158-159,p163,p173-174)
Brown(1976)
Fienberg(1980,p71-80,p97-98)
廣津(1982,p218-227)
坂元(1985,p16-36)
松田(1988,p137-140)
田中ほか(1990,p149-152,p169-173,p181-183,p188-199)
SAS(1990,p259-264)
などにおいて使用されている。分析結果はさまざまである。

統計手法。一つの文献で複数のものも多い。
χ2検定 Ries & Smith
対数線形モデル Goodman,Bishop et al.,Fienberg,Brown
ロジットモデル(反応変数型) Goodman,廣津、松田、田中ほか
分散分析モデル SAS,田中ほか,廣津
CATDAP   坂元
坂元は分析の中心をカテゴリーの併合においている。

abc順
Bishop,Y.M.M.,Fienberg,S.E.& Holland,P.W. 1975 Discrete Multivariate Analysis Theory and Practice, MIT Press.
Brown,M.B. 1976 Screening effects in multidimensional contingency tables, Applied Statistics, 25, 37-46
コックス、D.R.(後藤昌司・畠中駿逸・田崎武信訳) 1980 二値データの解析 朝倉書店
Fienberg,S.E. 1980 The analysis of cross-classified categorical data. 2nd ed. the MIT Press.
Goodman,L.A. 1978 Analyzing qualitative/categorical data: log-linear models and latent-structure analysis. Addison-Wesley Publishing.
廣津千尋 1982 離散データ解析 教育出版社
Ku,H.H. & Kullback,S. 1968 Interaction in multidimensional contingency tables: an inofrmation theoretic aproach. J.Res.Nat.Bur.Standards Sect B. 72, 159-199.
(引用されているが現物は見ていない)情報量
Goodman は分析上の問題点を指摘している。
松田紀之 1988 質的情報の多変量解析 朝倉書店
Ries,P.N. & Smith,,H. 1963The use of chi-square for preference testing in multidimensional problem, Chemical Engineering Progress Symposium series (A.I.Ch.E.:Symposium series), 59(42), 39-43.
坂元慶行 1985 カテゴリカルデータのモデル分析 共立出版
SAS(1990)SAS/STATTMユーザーズガイド Release 6.03 edition. SAS出版局
SAS(1993)SAS/STATTMユーザーズガイド first edition. SAS出版局(上と同じだがタイトルを少し変更)
田中豊・垂水共之・脇本和昌(1990)パソコン統計解析ハンドブックV多変量分散分析・線形モデル編 共立出版



堀 啓造ホームページへ