グループ(群)のデータを比較するときは、2グループの場合と比べて手間が増えます。
少し解釈が面倒になるので、本記事ではおおまかな流れを解説します。
おおまかな流れを把握したら、教科書を精査していただいて知識を深めていただきたいと思います。



まずは全体像の把握
3つのグループを比較する時は、まず全体像の把握が大切です。
”木を見て森を見ず”になってはいけません。
全体をみて、”あれちょっと違うかな??”ということを把握したあとで、
”じゃあ、どこが違うだろう??”という順序立てた統計処理が大切です。
では、以下の表にまとめます。
ここでも、パラメトリック、ノンパラメトリックは意識して使う必要があります。
パラメトリックが使える条件は以下を確認する必要があります。
- nが十分に多い
- 各群の分散が等しい
- 各群のデータは正規分布に従う
- 分布に極端な偏りがない
一元配置 と 二元配置
ANOVAには二種類あります。以下にまとめす。
- One-way ANOVA → 一元配置に適応 要素が一つ 単純
- Two-way ANOVA → 二元配置に適応 要素が二つ 複雑
だいぶこの辺で話が難しくなってきました。
なんで、話を単純化していきます。
身長のデータで具体化します。
一元配置は”国”の要素のみです。
二元配置は”国”と”部活動”の2要素です。
データの形式により適応する統計テクニックが違いますので注意しましょう。
全部の組み合わせで比較すればいいじゃないの?? → ダメです。信頼度が下がります。
たとえば、A、B、Cの3群の総当たりは以下のようになります。
- A vs B
- B vs C
- C vs A
です。これで全部でt検定をして有意差がなければ、全体として有意差なしで良いのか??
というと、ダメです。
有意差がない確率はα=0.05、p>0.05の時は95%です。
95%の確率が3回連続で起こる確率は
0.95 × 0.95 ×0.95 = 0.857 約86%です。
14%は有意差が出てくることになります。
これでは統計的に信頼に足るデータではなくなってきます。
なので、全体の比較→個別の比較 と進める必要があります。
これは群数が増えれば増えるほど、組み合わせが多くなるので、この方法では信頼性が保証できないのは明らかです。
↓おすすめ著書
created by Rinker¥2,640 (2021/01/16 02:03:37時点 楽天市場調べ-詳細)created by Rinker¥2,640 (2021/01/15 15:14:28時点 楽天市場調べ-詳細)