共分散構造分析 Structural Equation Modeling(SEM)

前提

  • 重回帰分析、因子分析あたりまで把握しておくと把握がモデルの容易
  • 共分散構造分析は、仮説構築ができていないとできないので、まずは仮説構築が重要

用語、概念

  • 基礎概念/変数の区別
    • 誤差:「e」で表す。○で囲む or 囲まない
    • 観測変数:「x」で表す実際に採ったデータ。□で囲まれた領域
    • 構成概念:「f」で表す。名付けられた因子。○または楕円で囲まれた領域
    • 共変関係は双方向の矢印
    • 潜在変数:構成概念と、誤差は実際には観測できないので潜在変数。
    • 構造変数:考察の対象になっている影響関係に直接・間接的に関係のある変数のこと。構成概念fは、まず構造変数。観測変数xもだいたいの場合はそう。
    • 外生変数:モデルのなかで、一度も他の変数の結果とならない変数。
    • 内生変数:少なくとも一回は、他の変数の結果になる変数のこと。
  • モデルの評価
    • 全体的評価:モデルとデータとの適合度を確認
    • 部分的評価:個々の母数の推定値が適切かどうか

install.packages

  • chooseCRANmirror()
  • install.packages("semPlot")
  • install.packages("semTools")
  • install.packages("lavaan")
  • install.packages("lavaan.servey")
  • install.packages("Amelia")
  • install.packages("GPArotation")
  • install.packages("MASS")
  • install.packages("moments")
  • install.packages("psych")

Libraryの展開

  • library("semPlot")
  • library("semTools")
  • library("lavaan")
  • library("lavaan.servey")
  • library("Amelia")
  • library("GPArotation")
  • library("MASS")
  • library("moments")
  • library("psych")

コマンド

リンク

統計関係英語(+ときどき軽い辞書)

  • Descriptive statistics 記述統計学:推定や検定を含まない。
  • inferential statistics 推計統計学:推定と検定を含む
  • interval scale 間隔尺度
  • ratio scale 比尺値
  • levels of measurement 尺度水準
  • ordinal scale 順序尺度
  • categorical variable カテゴリカル変数
  • dummy variable ダミー変数
  • multivariate data 多変量データ

-

因子分析

コマンド

> library("psych") #ライブラリの呼び出し
> (hoge<-read.csv('dat/hoge.csv',header=T,row.name="student")) #データの読み込み
> (hogehoge<-myfa(hoge)) #主成分分析とここまでは一緒。各因子のスコアを表示。横列で。これが初期解。関数myfaは因子数を指定すると、自動的に初期解と、回転解を選んでくれる。
> hogehoge$scores #hogehogeの共通因子スコアを表示
> taro <- hogehoge$scores #hogehogeの共通因子スコアを「taro」に格納
> colnames(taro) <- c('A','B','C') #因子の名付け
> round(taro,2) #各因子のスコアを表示。縦列で。
> plot(taro[,'A'],taro[,'B'],type='n',xlab='A',ylab="B") #プロットの箱を用意
> text(taro[,'A'],taro[,'B'],rownames(taro),cex=0.8) #プロットする
> fa(hoge,nfactors=3, rotate="varimax", fm="ml") #varimax回転した結果のデータを表示
> result<-fa(hoge,nfactors=3, rotate="varimax", fm="ml") #varimax回転した結果のデータを”result”に格納
> result$scores #主成分ごとのスコアを表示

関連ライブラリ

  • chooseCRANmirror() で、サーバー選択後に、install.packages( "ライブラリ名" ) でインストールしておく。
    • psych
    • psy
    • polycor
    • GPArotation
    • MCMCpack
    • moments
    • fBasics
    • lavaan

覚書

  • ML1:因子負荷
  • h2:共通性のスコア。これが1を超えているとまずい。共通性が1を越えてると、実際の分散より、多くの部分を因子が説明してしまっている
  • u2:独自性のスコア。
  • com:

用語

  • データの見方
    • 構成概念
    • 共通因子
    • 独自因子
    • 共通性
    • 独自性
    • 因子負荷
    • 因子分析モデル式の3つの仮定
    • 累積寄与率
    • 逆転項目
  • 回転
    • 単純構造
    • 直交回転
      • 初期解
      • リマックス varimax
      • クォーティマックス quartimax
      • エカマックス
      • オーソマックス
      • パーシマックス
      • 直交ジオミン回転 geominT
    • 斜交回転 ※社会科学系なら、まずこちらで。
      • プロマックス promax
      • オブリミン基準 oblimin
      • バイコーティミン biquartimin
      • シンプリマックス simplimax
      • ハリス・カイザー
      • 斜交ジオミン回転 geominQ
    • プロクラステス基準
  • 因子数の決定と命名
    • スクリープロット
    • ガットマン基準
    • MAPテスト
    • VSS基準
    • 因子の命名
  • 不適解
  • 信頼性係数の算出

web 資料

書籍

  • 豊田秀樹 編著『因子分析入門−Rで学ぶ最新データ解析』2012
    • Rベース
  • 松尾 太加志 (著), 中村 知靖『誰も教えてくれなかった因子分析』2002

ARIMA,SARIMA関係メモ

ーRで計量時系列分析:AR, MA, ARMA, ARIMAモデル, 予測


用語
−コレログラム(自己相関関数):「過去の値とどれくらい似ているか(あるいは似ていないか)を表すもの。」

分散分析のガイド系ページ

3つ以上の複数のグループ間の間(たとえば、複数のクラスの間のテストの結果の点数に差があるかどうか)とかを調べるために必要となるのが、分散分析だお

前提として重要なこと

  • 比較すべき基準がひとつの場合は、一元配置。
  • クロス表っぽくなってきたら二元配置。
  • 対応ありとか、対応なしとかも大事ですよ、と。
  • 多重比較検定とセットで考え方は理解しましょうね

解説ページリンク

  • 東北大学大学院農学研究科 資源生物科学専攻 動物遺伝育種学分野 による分散分析の解説
    • http://www.agri.tohoku.ac.jp/iden/toukei7.html
    • わかりやすい!なお、多重比較検定のページは→ http://www.agri.tohoku.ac.jp/iden/toukei8.html
    • 「分散分析はあくまで分散の一様性の検定に過ぎない」ので、どれとどれの間に差が生じてるかがわからんぜよ、と。
    • 個別に検定をかけてもいいんだけど、それをやると過剰に有意差が出てしまうから、それを回避するいろいろな方法があるんだよ、という解説まで。