らくがきちょう

文字数制限の無いTwitter的な

分散分析のF値から効果量偏イータ二乗を求める方法

事前の検定力分析をやるのが当たり前な風潮になってきた今日この頃、困るのが直接の親にあたる感じの先行研究で効果量が報告されていない場合。2010年前後ぐらいまでの研究だとけっこうある。

t検定のCohen's dは平均値の差と標準偏差の比なのでグラフや表を見ればだいたいわかるけど、分散分析だとそうもいかない。

とはいえ本質は分散説明率だし、ワンチャンF値から求められたりしない?と思って調べてみたところ、ありました。やったぜ。

 

f:id:MshrOkn:20220122225205p:plain

理屈

まず、分散分析表とF値は次のような関係になっている。

f:id:MshrOkn:20220122223635p:plain

そして偏イータ二乗は次式で定義される(要因が増えても同じ):

f:id:MshrOkn:20220122224931p:plain

 

以下、分散分析表の中の情報を使って①を変形すると上の定義式が導けることを示す。

腕に覚えのある人やパズルが好きな人はチャレンジしてみよう。そんなに難しくないです。

 

 

 

 

F値は平均平方和の比」という右端の式に注目。変形してみる。

f:id:MshrOkn:20220122225044p:plain

 

この②を式①の右辺に代入すると…

f:id:MshrOkn:20220122225717p:plain

 

というふうに、df_eが約分されて定義式と一致する。

 

余談

数式、TeXとかMarkdownとかでやりたかったけど難しくて断念して画像にしました…