2017-06-08

共分散構造分析 Structural Equation Modeling(SEM)

前提

重回帰分析、因子分析あたりまで把握しておくと把握がモデルの容易
共分散構造分析は、仮説構築ができていないとできないので、まずは仮説構築が重要

用語、概念

基礎概念／変数の区別
- 誤差：「e」で表す。○で囲む or 囲まない
- 観測変数：「x」で表す実際に採ったデータ。□で囲まれた領域
- 構成概念：「f」で表す。名付けられた因子。○または楕円で囲まれた領域
- 共変関係は双方向の矢印
- 潜在変数：構成概念と、誤差は実際には観測できないので潜在変数。
- 構造変数：考察の対象になっている影響関係に直接・間接的に関係のある変数のこと。構成概念fは、まず構造変数。観測変数xもだいたいの場合はそう。
- 外生変数：モデルのなかで、一度も他の変数の結果とならない変数。
- 内生変数：少なくとも一回は、他の変数の結果になる変数のこと。
モデルの評価
- 全体的評価：モデルとデータとの適合度を確認
- 部分的評価：個々の母数の推定値が適切かどうか

install.packages

chooseCRANmirror()
install.packages("semPlot")
install.packages("semTools")
install.packages("lavaan")
install.packages("lavaan.servey")
install.packages("Amelia")
install.packages("GPArotation")
install.packages("MASS")
install.packages("moments")
install.packages("psych")

Libraryの展開

library("semPlot")
library("semTools")
library("lavaan")
library("lavaan.servey")
library("Amelia")
library("GPArotation")
library("MASS")
library("moments")
library("psych")

コマンド

リンク

ＳＥＭＦＡＱ：共分散構造分析に関する10の質問（三浦麻子×狩野裕）
- https://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&uact=8&ved=0ahUKEwi37764pr_VAhUMp5QKHUMjCkgQFggoMAA&url=http%3A%2F%2Fwww.sigmath.es.osaka-u.ac.jp%2F~kano%2Fresearch%2Fapplication%2Fothers%2FSEMFAQ10_1.ppt&usg=AFQjCNFZimCveL0O_esr7dmmdUe-v0Td8A

wiki:Rで共分散構造分析・構造方程式モデル
- http://www.okadajp.org/RWiki/?R%E3%81%A7%E5%85%B1%E5%88%86%E6%95%A3%E6%A7%8B%E9%80%A0%E5%88%86%E6%9E%90%E3%83%BB%E6%A7%8B%E9%80%A0%E6%96%B9%E7%A8%8B%E5%BC%8F%E3%83%A2%E3%83%87%E3%83%AB
書籍：『共分散構造分析[Ｒ編]　--構造方程式モデリング』豊田秀樹編著
- http://www.tokyo-tosho.co.jp/books/978-4-489-02180-0/
- ページから、サンプル用のデータのDLが可能。
構造方程式モデリング、基本のキ（Shinohara Masahiro）
- https://www.slideshare.net/MasahiroShinohara/100614-4502873
共分散構造分析の基礎と実際----基礎編----（狩野裕）
- http://csrda.iss.u-tokyo.ac.jp/seminar2002_1.pdf
構造方程式モデリングは因子分析、分散分析、パス解析のすべてにとって代わるのか（狩野裕）
- https://www.jstage.jst.go.jp/article/jbhmk/29/2/29_2_138/_pdf

2017-06-06

統計関係英語（＋ときどき軽い辞書）

Descriptive statistics 記述統計学：推定や検定を含まない。
inferential statistics 推計統計学：推定と検定を含む
interval scale　間隔尺度
ratio scale 比尺値
levels of measurement 尺度水準
ordinal scale 順序尺度
categorical variable カテゴリカル変数
dummy variable ダミー変数
multivariate data 多変量データ

2017-03-27

因子分析

コマンド

> library("psych") #ライブラリの呼び出し
> (hoge<-read.csv('dat/hoge.csv',header=T,row.name="student")) #データの読み込み
> (hogehoge<-myfa(hoge)) #主成分分析とここまでは一緒。各因子のスコアを表示。横列で。これが初期解。関数myfaは因子数を指定すると、自動的に初期解と、回転解を選んでくれる。
> hogehoge$scores #hogehogeの共通因子スコアを表示
> taro <- hogehoge$scores #hogehogeの共通因子スコアを「taro」に格納
> colnames(taro) <- c('A','B','C') #因子の名付け
> round(taro,2) #各因子のスコアを表示。縦列で。
> plot(taro[,'A'],taro[,'B'],type='n',xlab='A',ylab="B") #プロットの箱を用意
> text(taro[,'A'],taro[,'B'],rownames(taro),cex=0.8) #プロットする
> fa(hoge,nfactors=3, rotate="varimax", fm="ml") #varimax回転した結果のデータを表示
> result<-fa(hoge,nfactors=3, rotate="varimax", fm="ml") #varimax回転した結果のデータを”result”に格納
> result$scores #主成分ごとのスコアを表示

覚書

ML1:因子負荷
h2:共通性のスコア。これが1を超えているとまずい。共通性が1を越えてると、実際の分散より、多くの部分を因子が説明してしまっている
u2:独自性のスコア。
com:

用語

データの見方
- 構成概念
- 共通因子
- 独自因子
- 共通性
- 独自性
- 因子負荷
- 因子分析モデル式の３つの仮定
- 累積寄与率
- 逆転項目
回転
- 単純構造
- 直交回転
  - 初期解
  - バリマックス varimax
  - クォーティマックス quartimax
  - エカマックス
  - オーソマックス
  - パーシマックス
  - 直交ジオミン回転 geominT
- 斜交回転 ※社会科学系なら、まずこちらで。
  - プロマックス promax
  - オブリミン基準 oblimin
  - バイコーティミン biquartimin
  - シンプリマックス simplimax
  - ハリス・カイザー
  - 斜交ジオミン回転 geominQ
- プロクラステス基準
因子数の決定と命名
- スクリープロット
- ガットマン基準
- MAPテスト
- VSS基準
- 因子の命名
不適解
信頼性係数の算出

web 資料

R で因子分析：入門編（中澤港）
- http://minato.sip21c.org/factor-in-R-j.pdf
- 10ページほどの説明でけっこう詳しい。
pdf:Rによる因子分析（奥村太一／2016.2.1)
- http://www.juen.ac.jp/lab/okumura/handout/160201R%E3%81%AB%E3%82%88%E3%82%8B%E5%9B%A0%E5%AD%90%E5%88%86%E6%9E%90.pages.pdf
- 4ページほどの説明
パワポ：Rで因子分析　商用ソフトで実行できない因子分析のあれこれ（清水裕士）
- https://www.slideshare.net/simizu706/r-42283141
- 中級編。因子数の決定手法や、回転方法などについて。「あかん因子分析の流れ」がよい。
AMOSによる構造方程式モデルの分析入門
- http://www2.rikkyo.ac.jp/web/murase/seminar/13amos.pdf
奥村泰之：中級者による初心者のための「探索的因子分析」
- http://researchmap.jp/murevsmn3-51087/?action=multidatabase_action_main_filedownload&download_flag=1&upload_id=31426&metadata_id=29089

因子負荷量とは？：教えてgoo
- https://oshiete.goo.ne.jp/qa/631619.html

is this LOVE? (狩野裕氏による探索的因子分析／検証的因子分析の解説がある)
- http://www.sigmath.es.osaka-u.ac.jp/~kano/research/application/love/html/sld001.htm

因子分析・確証的因子分析
- http://cogpsy.educ.kyoto-u.ac.jp/personal/Kusumi/datasem11/osanai.pdf
CFA(検証的因子分析)については、下記の狩野氏によるものも参照
- https://www.jstage.jst.go.jp/article/jbhmk/29/2/29_2_138/_pdf
因子分析のEFA,CFAの違いについての解説（平井明代氏のウェブサイト）
- http://www.u.tsukuba.ac.jp/~hirai.akiyo.ft/forstudents/eigokyouikugaku7.files/M4_9(N.K.).pdf

Rチュートリアル
- http://psycho.edu.yamaguchi-u.ac.jp/wordpress/wp-content/uploads/2014/01/R_tutorial20131.pdf
- 下のほうに信頼性係数 alphaについての説明あり

書籍

豊田秀樹編著『因子分析入門−Rで学ぶ最新データ解析』2012
- Rベース
松尾太加志 (著), 中村知靖『誰も教えてくれなかった因子分析』2002
- SPSSがベース

2017-03-08

統計の数式読む時用のメモ

高校数学的な基礎

シグマの読み方

算術平均（相加平均）

統計系の基礎

記号	意味
$\mu$	母平均
$\overline{x}$	標本( $x_1 , x_2 \cdots x_n$ )の平均
$\sigma^{2}$	母分散
$s^{2}$	標本分散
$r_{xy}, r$	標本相関係数
$r_{xy \cdot z}$	偏相関係数
$\Omega$	全事象・標本空間

2015-10-05

ARIMA,SARIMA関係メモ

時系列分析【マジですごく丁寧！】
- http://www.ec.kansai-u.ac.jp/user/arakit/documents/lbrtsJan242014.pdf
TokyoR
- http://d.hatena.ne.jp/yokkuns/20110924/1316857277

ｰRで計量時系列分析：AR, MA, ARMA, ARIMAモデル, 予測

- http://tjo.hatenablog.com/entry/2013/07/12/184704
  - {forecast}をインストールせよとのことなので「chooseCRANmirror()　」とうつべし。
  - パッケージのインストールの仕方　→　http://d.hatena.ne.jp/maskin-monotonicity/20130430/1377237241

R Time Series Analysis 時系列解析(14) SARIMAモデル
- http://nakhirot.hatenablog.com/entry/20130716/1373910979

用語
−コレログラム（自己相関関数）：「過去の値とどれくらい似ているか（あるいは似ていないか）を表すもの。」

2015-03-01

分散分析のガイド系ページ

メモ

３つ以上の複数のグループ間の間（たとえば、複数のクラスの間のテストの結果の点数に差があるかどうか）とかを調べるために必要となるのが、分散分析だお

前提として重要なこと

比較すべき基準がひとつの場合は、一元配置。
クロス表っぽくなってきたら二元配置。
対応ありとか、対応なしとかも大事ですよ、と。
多重比較検定とセットで考え方は理解しましょうね

解説ページリンク

東北大学大学院農学研究科資源生物科学専攻動物遺伝育種学分野　による分散分析の解説
- http://www.agri.tohoku.ac.jp/iden/toukei7.html
- わかりやすい！なお、多重比較検定のページは→　http://www.agri.tohoku.ac.jp/iden/toukei8.html
- 「分散分析はあくまで分散の一様性の検定に過ぎない」ので、どれとどれの間に差が生じてるかがわからんぜよ、と。
- 個別に検定をかけてもいいんだけど、それをやると過剰に有意差が出てしまうから、それを回避するいろいろな方法があるんだよ、という解説まで。

滋賀医科大学　小山なつ先生「私のための統計処理」
- http://www.shiga-med.ac.jp/~koyama/stat/com-ph.html
- 一度勉強し終えた人の復習用ノート！

【Excel】早稲田大学　阿部圭司先生のページ
- http://www.aoni.waseda.jp/abek/document/anova.html
- 必要なことがミニマムに。

【Excel,SPSS】関西大　水本篤先生（語学学習効果とかがご専門らしい）のサイト
- http://mizumot.com/handbook/wp-content/uploads/ANOVA1.pdf
- ExcelとSPSSでもって、比較する群の間の対応ありバージョン、対応なしバージョンのやり方を解説。ていねい！

【r】バイオスタティクスのサイト
- http://stat.biopapyrus.net/nlm/anova-r.html
- anovaとかaov関数を使うといいですよ、という話をしている。

【r】帯広畜産大学増田豊先生
- 一元配置の分散分析　http://www.obihiro.ac.jp/~masuday/resources/stat/r_anova1way.html
- rの解析結果の日本語が

対応なし、標本数が異なる場合の分析
- http://monge.tec.fukuoka-u.ac.jp/r_analysis/test_anova03.html

2014-07-15

テキストマイニング系ツール

KH Coder
- http://khc.sourceforge.net/

TextSeer
- http://www.valdes.titech.ac.jp/~t_kawa/

[ 馬脚 ]

共分散構造分析 Structural Equation Modeling(SEM)

前提

用語、概念

install.packages

Libraryの展開

コマンド

リンク

統計関係英語（＋ときどき軽い辞書）

因子分析

コマンド

関連ライブラリ

覚書

用語

web 資料

書籍

統計の数式読む時用のメモ

高校数学的な基礎

シグマの読み方

算術平均（相加平均）

統計系の基礎

ARIMA,SARIMA関係メモ

分散分析のガイド系ページ

解説ページリンク

テキストマイニング系ツール