平均値の比較を行う場合に”対応の有無”で選択する必要があります。
そもそも”データの対応”が何かを理解しないと正しい選択ができません。
今回は、この”対応”について、そして、それに応じて選択する検定方法のまとめです。
”対応”って何?
これはデータが”1個体 or グループ”からとられているか、否かです。
下の図のようにまとめることができます。
対応ありの場合は一個体に対して。施行する方法を変えます。
対応なしの場合、二個体に対して、一つの方法を施行します。
では、もう少し噛み砕いていきます。
これを書いている季節は冬なので、季節にちなんだインフルエンザ薬を例を挙げます。
研究データというよりは、普通の会話表現で考えてみます。風邪薬についてです。
対応あり
僕は薬Aより薬Bの方が良く効いた
データの発生元が僕自身なので”対応のある関係”
対応なし
僕は薬Aでなおったけど、彼にはあまり効果がなかった。
データの発生元が二者なので”対応のない関係”
対応のあるなしはデータの発生もとが一個に収束するかどうかを考えればOKです。
対応の有無と統計テクニック
対応の有無とその時に選択すべき平均値比較の統計テクニックを下の図にまとめます。
まず、一つの注意点として、”対応なし、ノンパラメトッリク”でググった場合に、
二種類の統計技術が紹介されていると思います。
Man-Whitney’s U testとウィルコクソンの順位和検定というのが、同じものです。
ウィルコクソンの符号順位検定 = Wilcoxon signed-rank test (対応あり、ノンパラメトリック)と混同しやすいです。気をつけてください。
混乱をさけるために、Wilcoxonを二種類おぼえるよりは、
Wilcoxon signed-rank test と Man-Whitney’s U testで記憶した方が良いと思います。
僕もいまだに訳が分からなく時があったりします。
↓おすすめ著書
コメディカル統計テキスト エクセル活用 [ 宮城重二 ]created by Rinker¥2,640 (2019/12/05 14:09:12時点 楽天市場調べ-詳細)
統計解析なんかこわくない 第2版 データ整理から学会発表まで [ 田久 浩志 ]created by Rinker¥2,640 (2019/12/05 14:09:12時点 楽天市場調べ-詳細)
さらに、厳密には対応なしのパラメトリック検定であるt-testもデータが当分散が否かで、
使用する統計テクニックが変わりますが、
JMPなどでの統計ソフトでは自動処理してくれるので、
本項ではt-testで一本化しています。
ということで、今回は対応の有無と選択すべき検定方法についてまとめました。