問題
IV-17 下表は、分散分析の一部を示したものである。この結果に関する記述として、最も適切なものはどれか。
なお、F分布における自由度Φ1=1、Φ2=4のときの上側5パーセント点は7.71であり、上側1パーセント点は21.2とする。
要因 | 平方和 | 自由度 | 平均平方 | 分散比 |
---|---|---|---|---|
A | 10 | 1 | 10 | |
B | 35 | 1 | 35 | |
C | 25 | 1 | 25 | |
誤差e | 15 | 4 | 3.75 | |
合計 | 85 | 7 | – |
① Aは、有意水準5%で有意である。
② Bは、有意水準5%で有意である。
③ Cは、有意水準5%で有意である。
④ BとCは、有意水準1%で有意である。
⑤ A、B及びCは、どれも有意でない。
解答
正解は 2 になります。
この問題は「分散分析」に関するものです。
分散分析は、複数のグループの平均値に差があるかどうかを調べるための統計手法です。
ここでは、各要因(A, B, C)が有意かどうかを判断するために、F検定という方法を使います。
分散分析表の読み方
まず、表に示されている各項目について説明します。
- 要因: A, B, Cという3つの要因があり、それぞれが異なる条件やグループを表しています。
- 平方和: これは各要因が全体のデータにどれだけ影響を与えているかを示す値です。
- 自由度: 各要因に対応する自由度です。自由度は、データの独立した情報量を表します。
- 平均平方: 平方和を自由度で割った値です。これが分散を表します。
- 分散比: 要因ごとの平均平方を誤差の平均平方で割った値です。これがF値となり、F検定で使われます。
F検定とは?
F検定は、要因が有意かどうか、つまりその要因が結果に影響を与えているかどうかを調べる方法です。F値が大きいほど、その要因は有意である可能性が高くなります。
問題の解き方
ステップ1: F値の計算
表にある「分散比」という項目にF値をいれていきましょう。
F値は要因ごとの平均平方を誤差の平均平方で割った値でしたね。
- AのF値 = 10 ÷ 3.75 = 2.67
- BのF値 = 35 ÷ 3.75 = 9.33
- CのF値 = 25 ÷ 3.75 = 6.67
ステップ2: F分布表と比較
問題文には、「上側5パーセント点(有意水準5%)」と「上側1パーセント点(有意水準1%)」のF分布表から得られる臨界値が与えられています。
- 自由度 Φ1=1 と Φ2=4 の場合:
- 有意水準5%での臨界値は 7.71。
- 有意水準1%での臨界値は 21.2。
ステップ3: 各要因が有意かどうか判断
- AのF値 (2.67) は、5%水準 (7.71) より小さいので、有意ではありません。
- BのF値 (9.33) は、5%水準 (7.71) より大きいので、有意です。ただし、1%水準 (21.2) より小さいので、1%では有意ではありません。
- CのF値 (6.67) は、5%水準 (7.71) より小さいので、有意ではありません。
結論
選択肢ごとに確認すると:
- Aは有意水準5%で有意 → 誤り(Aは有意ではない)
- Bは有意水準5%で有意 → 正しい(Bは5%水準で有意)
- Cは有意水準5%で有意 → 誤り(Cは有意ではない)
- BとCは有意水準1%で有意 → 誤り(BもCも1%では有意ではない)
- A, B及びCはどれも有意でない → 誤り(Bは5%で有意)
したがって、正解は【2】です。
図解による補足
以下に簡単な図で説明します:
--------------------------------------------| 要因 | F値 | 5%水準(7.71) | 1%水準(21.2) |--------------------------------------------| A | 2.67 | × | × || B | 9.33 | ○ | × || C | 6.67 | × | × |--------------------------------------------
この図からもわかるように、Bだけが5%水準で「○」、つまり有意となります。他の要因AとCはどちらも「×」なので、有意ではありません。
最後に
この問題では、「分散分析」と「F検定」を使ってデータの違いが偶然によるものかどうかを判断します。最も重要なポイントは、F値と臨界値を比較して、その要因が結果に影響しているかどうかを確認することです。
感想
F検定、知りませんでした。
そもそもF検定のFってなに?ってレベル。
調べてみると人名らしいですね。
「F」は、統計学者ロナルド・A・フィッシャー(Ronald A. Fisher)に由来しています。彼は統計学の発展に大きく貢献し、特に分散分析や仮説検定の基礎を築いた人物です。
なのだそうです。
それにしても、表の問題が出てくると避けたくなってしまうクセを治さないといけませんな。