英語教育に関する論文に目を通すと、しばし統計学でいうt検定による検証が行われているのを目にします。このt検定とはどういうときに役立つのでしょうか。
t検定は、2つの異なる環境のグループ間で平均値に違いがあるかを調べる時に使います。
例えば、ある地域で新しい英語教育の指導法を試したとします。それによって異なる学校での教育環境が生徒の英語能力にどう影響するかを調査し、実際に効果があるかを見たいとします。この場合、新しい方法で指導した学校と従来の方法で指導した学校の英語のテストの平均点を比べるためにt検定を使っています。t検定の結果から、新しい指導法が有意に効果があるかどうかを判断することができるようです。
有意性を評価する際には「p値(p-value)」という数値が使われます。p値は、私たちが「二つのグループの間には平均値に差がない」という仮説(帰無仮説と呼ばれます)をテストするために使う指標です。このp値が小さいほど、実際には平均値に差がある可能性が高くなります。
例えば、p値が0.05(5%)以下だった場合、「二つのグループの間には差がない」という仮説が正しいとしたら、大きな差が出る確率は5%以下だということになります。これはとても低い確率なので、「やはり平均値には差があるのではないか」と考えることが妥当だと判断されるというものでしょうか。このため、研究者たちは「平均値に差がない」という仮説を棄却し、実際には差があると結論付けることが多いというふうに思います。
要するに、p値が小さいほど、私たちが見ている差がたまたまではなく、本当に意味のある差である可能性が高くなるということがわかります。
このようにt検定が英語教育でも頻繁に使用されていることから、有意性を科学的に証明するのに大きな役割を果たしているのだと思いました。