t検定とは|簡単解説
t検定のカンタン語句解説
t検定とは、2つの母集団の平均値を検定するための方法です。同様に平均値の検定であるz検定は母分散がわかっている場合にのみ使用できるのに対し、t検定は母分散がわからない場合にも用いることができます。
t検定の基礎知識
ある共通の目的のために実施した複数の取り組みにおいて、それぞれの結果の平均値に差が出た場合、統計的に意味のある差なのかを知るためにt検定を用います。統計的に意味のある差ではなく誤差の範囲であった、という事実を検証するためにも有用です。
平均値の差を検定したい場合で、標本が多いとき(=自由度がおおいとき)は正規分布を用いて、標本が少ないときはt分布を用いてt検定を利用するのが一般的です。
ある学校の二つのクラスにおいて、和食だけを食べるクラスと洋食だけを食べるクラスに分けて、3ヶ月後の体重増減を比較する場合で、以下のような結果になったとします。
クラス平均 | 出席番号1 | 出席番号2 | 出席番号3 | 出席番号4 | 出席番号5 | 出席番号…… | |
和食 | -1.0kg | +0.5kg | -1kg | -2kg | 2kg | ±0kg | …… |
洋食 | +1.0kg | +1kg | +1.5kg | +2kg | ±0kg | -0.5kg | …… |
和食クラスの体重増減平均は-1.0kgで、洋食クラスの体重増減平均は+1.0kgでした。和食は1.0kgの減量になって、洋食は1.0kgの増量になるという結果が、統計的に正しいのか、それとも誤差の範囲かを検定するために用いられるのがt検定です。
t検定を理解するのに知っておきたい単語
t検定を理解するにあたり、押さえておきたい単語は以下の3つです。
帰無仮説
帰無仮説は、知りたい事実と反対の事実を仮説として設定することです。知りたい事象の確率を直接計算するのが困難なため、その背反する事象の確率を計算することによって、仮説の検証を行います。棄却することを目的とするため、「無に帰する仮説」=帰無仮説と言われます。
たとえば、内容量500mlの清涼飲料水を製造していた場合、ランダムに選ばれた10個を対象に平均500mlとしてもよいかを判定したいとします。
この場合、帰無仮説は「平均は500mlである」となります。
対立仮説
対立仮説とは、帰無仮説に対する仮説です。帰無仮説が「平均は500mlである」の場合、対立仮説は「平均は500mlでない」と言えます。
※帰無仮説と対立仮説を立てて検定を行なうスミルノフ・グラブス検定について触れている、異常値の紹介はこちらの記事から。
有意水準
有意水準とは、何かを判断する基準のことです。有意水準は5%に設定される場合が多く、5%以下の確率で生じる現象は、滅多に発生しないと判定します。
t検定の種類
t検定は大きく、1つの母集団からサンプリングした1つの標本を使用する「1標本t検定」と、2つの母集団からサンプリングした2つの標本を使用する「2標本t検定」の2つにわかれます。
2標本t検定は、「対応のある2標本t検定」と「対応のない2標本t検定」にわかれ、「対応のない2標本t検定」に関してはさらに「Studentのt検定」と「Welchのt検定」にわかれます。
対応のある2標本t検定とは、同じ人やもので2回計測した平均の差を評価することです。たとえば、同人物のダイエットを始める前の日とダイエットをした1か月後のデータを比較する場合が該当します。
反対に、対応のない2標本t検定とは、違う人やもので計測した平均の差を評価することです。たとえば、1組と2組のクラスの平均点を比較する場合が該当します。
t検定の手順解説(エクセル使用)
ここでは、以下の例をもとにt検定の手順を解説します。
内容量500mlの清涼飲料水を生産している企業が、無作為に選んだ10個の製品を対象に平均500mlかどうかを判断します。 |
1.「帰無仮説」を立てて「有意水準」を設定する
まずは、知りたい事実と反対の主張である「帰無仮説」を立てます。
今回の場合、「平均が500mlである」が帰無仮説です。なお、対立仮説は「平均は500mlではない」となります。
先述のとおり、有意水準は5%を用いるのが一般的です。
2.t値を算出
t値とは、比較するデータの有意性を示す値です。t値を求めるにはまず、平均値と標準偏差を求めます。
平均値は「=AVERAGE(セル1:セル2)」、標準偏差は「STDEV.S(セル1:セル2)」で求めることが可能です。
データの平均値と標準偏差、サンプル数を用いて、統計量tの絶対値を計算します。
「=ABS(平均-母平均)/(標準偏差/SQRT(サンプル数))」で求めることが可能です。
3.p値を算出
p値とは得られたデータの希少性を示す数値です。
まずは「=T.DIST(t値の絶対値,サンプル数-1,TRUE)」で累積確率を求めます。
1から累積確率を引くと、p値が求まります。上記の例の場合は、「0.19549855」です。
4.p値と有意水準を比較
p値と有意水準を比較し、p値が有意水準よりも小さい場合は、そのデータは起こりにくいと判断できます。
5.帰無仮説を棄却
ここまでの手順により、帰無仮説である「平均が500mlである」を棄却できます。つまり、示したい結果を示せたということです。
t検定まとめ
t検定とは仮説検定で用いられる方法のひとつで、2つの母集団の平均を検証するための方法です。「t分布」を使った検定は「t検定」と総称されています。
t分布とは、最も一般的な分布である「正規分布」の母集団に関して、データの散らばり方を意味する「母分散」が不明なときに利用されます。
母分散がわからない場合やサンプル数が少ない場合でも仮説検証できるため、製品の品質管理や効果判定など、さまざまな場面で活用されています。
エクセルを使用すると比較的簡単に仮説検証できるため、平均値に差があった場合や人によって判断がわかれそうな場合などにt検定を活用してみてはいかがでしょうか。