共分散構造分析 Structural Equation Modeling(SEM)
前提
- 重回帰分析、因子分析あたりまで把握しておくと把握がモデルの容易
- 共分散構造分析は、仮説構築ができていないとできないので、まずは仮説構築が重要
用語、概念
- 基礎概念/変数の区別
- 誤差:「e」で表す。○で囲む or 囲まない
- 観測変数:「x」で表す実際に採ったデータ。□で囲まれた領域
- 構成概念:「f」で表す。名付けられた因子。○または楕円で囲まれた領域
- 共変関係は双方向の矢印
- 潜在変数:構成概念と、誤差は実際には観測できないので潜在変数。
- 構造変数:考察の対象になっている影響関係に直接・間接的に関係のある変数のこと。構成概念fは、まず構造変数。観測変数xもだいたいの場合はそう。
- 外生変数:モデルのなかで、一度も他の変数の結果とならない変数。
- 内生変数:少なくとも一回は、他の変数の結果になる変数のこと。
- モデルの評価
- 全体的評価:モデルとデータとの適合度を確認
- 部分的評価:個々の母数の推定値が適切かどうか
install.packages
- chooseCRANmirror()
- install.packages("semPlot")
- install.packages("semTools")
- install.packages("lavaan")
- install.packages("lavaan.servey")
- install.packages("Amelia")
- install.packages("GPArotation")
- install.packages("MASS")
- install.packages("moments")
- install.packages("psych")
Libraryの展開
- library("semPlot")
- library("semTools")
- library("lavaan")
- library("lavaan.servey")
- library("Amelia")
- library("GPArotation")
- library("MASS")
- library("moments")
- library("psych")
コマンド
リンク
- SEMFAQ:共分散構造分析に関する10の質問(三浦麻子×狩野裕)
- wiki:Rで共分散構造分析・構造方程式モデル
- 書籍:『共分散構造分析[R編] --構造方程式モデリング』豊田秀樹 編著
- http://www.tokyo-tosho.co.jp/books/978-4-489-02180-0/
- ページから、サンプル用のデータのDLが可能。
- 構造方程式モデリング、基本のキ(Shinohara Masahiro)
- 共分散構造分析の基礎と実際----基礎編----(狩野裕)
- 構造方程式モデリングは因子分析、分散分析、パス解析のすべてにとって代わるのか(狩野裕)
因子分析
コマンド
> library("psych") #ライブラリの呼び出し
> (hoge<-read.csv('dat/hoge.csv',header=T,row.name="student")) #データの読み込み
> (hogehoge<-myfa(hoge)) #主成分分析とここまでは一緒。各因子のスコアを表示。横列で。これが初期解。関数myfaは因子数を指定すると、自動的に初期解と、回転解を選んでくれる。
> hogehoge$scores #hogehogeの共通因子スコアを表示
> taro <- hogehoge$scores #hogehogeの共通因子スコアを「taro」に格納
> colnames(taro) <- c('A','B','C') #因子の名付け
> round(taro,2) #各因子のスコアを表示。縦列で。
> plot(taro[,'A'],taro[,'B'],type='n',xlab='A',ylab="B") #プロットの箱を用意
> text(taro[,'A'],taro[,'B'],rownames(taro),cex=0.8) #プロットする
> fa(hoge,nfactors=3, rotate="varimax", fm="ml") #varimax回転した結果のデータを表示
> result<-fa(hoge,nfactors=3, rotate="varimax", fm="ml") #varimax回転した結果のデータを”result”に格納
> result$scores #主成分ごとのスコアを表示
関連ライブラリ
- chooseCRANmirror() で、サーバー選択後に、install.packages( "ライブラリ名" ) でインストールしておく。
- psych
- psy
- polycor
- GPArotation
- MCMCpack
- moments
- fBasics
- lavaan
覚書
- ML1:因子負荷
- h2:共通性のスコア。これが1を超えているとまずい。共通性が1を越えてると、実際の分散より、多くの部分を因子が説明してしまっている
- u2:独自性のスコア。
- com:
用語
web 資料
- R で因子分析:入門編(中澤港)
- http://minato.sip21c.org/factor-in-R-j.pdf
- 10ページほどの説明でけっこう詳しい。
- pdf:Rによる因子分析(奥村太一 /2016.2.1)
- パワポ:Rで因子分析 商用ソフトで実行できない因子分析のあれこれ(清水裕士)
- https://www.slideshare.net/simizu706/r-42283141
- 中級編。因子数の決定手法や、回転方法などについて。「あかん因子分析の流れ」がよい。
- AMOSによる構造方程式モデルの分析入門
- 奥村泰之:中級者による初心者のための「探索的因子分析」
- is this LOVE? (狩野裕氏による探索的因子分析/検証的因子分析の解説がある)
- 因子分析・確証的因子分析
- CFA(検証的因子分析)については、下記の狩野氏によるものも参照
- 因子分析のEFA,CFAの違いについての解説(平井明代氏のウェブサイト)
- Rチュートリアル
- http://psycho.edu.yamaguchi-u.ac.jp/wordpress/wp-content/uploads/2014/01/R_tutorial20131.pdf
- 下のほうに信頼性係数 alphaについての説明あり
書籍
- 豊田秀樹 編著『因子分析入門−Rで学ぶ最新データ解析』2012
- Rベース
- 松尾 太加志 (著), 中村 知靖『誰も教えてくれなかった因子分析』2002
- SPSSがベース
ARIMA,SARIMA関係メモ
- 時系列分析【マジですごく丁寧!】
- TokyoR
ーRで計量時系列分析:AR, MA, ARMA, ARIMAモデル, 予測
-
- http://tjo.hatenablog.com/entry/2013/07/12/184704
- {forecast}をインストールせよとのことなので「chooseCRANmirror() 」とうつべし。
- パッケージのインストールの仕方 → http://d.hatena.ne.jp/maskin-monotonicity/20130430/1377237241
- http://tjo.hatenablog.com/entry/2013/07/12/184704
- R Time Series Analysis 時系列解析(14) SARIMAモデル
用語
−コレログラム(自己相関関数):「過去の値とどれくらい似ているか(あるいは似ていないか)を表すもの。」
分散分析のガイド系ページ
3つ以上の複数のグループ間の間(たとえば、複数のクラスの間のテストの結果の点数に差があるかどうか)とかを調べるために必要となるのが、分散分析だお
前提として重要なこと
- 比較すべき基準がひとつの場合は、一元配置。
- クロス表っぽくなってきたら二元配置。
- 対応ありとか、対応なしとかも大事ですよ、と。
- 多重比較検定とセットで考え方は理解しましょうね
解説ページリンク
- 東北大学大学院農学研究科 資源生物科学専攻 動物遺伝育種学分野 による分散分析の解説
- http://www.agri.tohoku.ac.jp/iden/toukei7.html
- わかりやすい!なお、多重比較検定のページは→ http://www.agri.tohoku.ac.jp/iden/toukei8.html
- 「分散分析はあくまで分散の一様性の検定に過ぎない」ので、どれとどれの間に差が生じてるかがわからんぜよ、と。
- 個別に検定をかけてもいいんだけど、それをやると過剰に有意差が出てしまうから、それを回避するいろいろな方法があるんだよ、という解説まで。
- 滋賀医科大学 小山なつ先生「私のための統計処理」
- http://www.shiga-med.ac.jp/~koyama/stat/com-ph.html
- 一度勉強し終えた人の復習用ノート!
- 【Excel】早稲田大学 阿部圭司先生のページ
- http://www.aoni.waseda.jp/abek/document/anova.html
- 必要なことがミニマムに。
- 【Excel,SPSS】関西大 水本 篤先生(語学学習効果とかがご専門らしい)のサイト
- http://mizumot.com/handbook/wp-content/uploads/ANOVA1.pdf
- ExcelとSPSSでもって、比較する群の間の対応ありバージョン、対応なしバージョンのやり方を解説。ていねい!
- 【r】バイオスタティクスのサイト
- http://stat.biopapyrus.net/nlm/anova-r.html
- anovaとかaov関数を使うといいですよ、という話をしている。
- 【r】帯広畜産大学 増田豊先生
- 一元配置の分散分析 http://www.obihiro.ac.jp/~masuday/resources/stat/r_anova1way.html
- rの解析結果の日本語が
- 対応なし、標本数が異なる場合の分析
テキストマイニング系ツール
- KH Coder