正規分布とは|簡単解説

正規分布の意味とは

正規分布のカンタン語句解説

正規分布とは、左右対称の釣鐘型もしくは山型の分布を指します。統計・統計学を理解する上で大切な確率分布です。平均値と最頻値中央値が一致するという特徴があります。平均値を中心にして左右対称であることも特徴です。

正規分布とは

正規分布を理解していただくために、以下のグラフをご覧ください。左右対称の釣鐘型のグラフですが、これが正規分布を表しています。

ガウス分布のイメージ図

ドイツの数学者であり物理学者、天文学者でもある「カール・フリードリヒ・ガウス」の名前を取って「ガウス分布」とも言われています。

正規分布の横軸は確率変数、縦軸は確率密度です。英語では Normal Distributionと言い、 「この世でもっとも一般的な分布」とも言われています。正規分布を活用すると、ある現象の発生確率を計算できる可能性が高まります。

正規分布曲線には、以下のような性質があります。

期待値(平均値)と最頻値と中央値が一致する𝑥 軸を漸近線(ぜんきんせん)とする平均値を中心にして左右対称(𝑦 は 𝑥=𝑚 で最大値をとる)曲線の山は標準偏差(分散)が大きくなるほど低くなり、左右に広がる。標準偏差(分散)が小さくなるほど山が高くなり、よりとんがった形になる。

なお、正規分布の表記方法は以下の通りです。

μ:期待値(平均値)𝜎2:分散 𝜎 :標準偏差 

最も発生確率が高いところを期待値(平均値)「μ」で表し、μから距離が遠くなるほど発生確率は低くなります。

※同時に理解しておきたい「標準偏差」の語句解説はこちらからご確認ください。

正規分布の式

正規分布は、以下の確率密度関数で表すことが可能です。

なお、上記の式を暗記する必要はありません。

重要なのは、期待値(平均値)を表す「μ」と標準偏差を表す「𝜎 」です。「μ」と「𝜎 」の数値がわかると、分布の形や発生する確率がわかります。

正規分布をExcelで作成する方法

ここでは、正規分布曲線をExcelで作成する方法を詳しく解説します。

1.データを用意する

まずは、正規分布を作成するためのデータを用意します。

例として今回は、μ=0、σ=1の正規分布を作成します。仮に​ xの値を-5.0から0.1刻みで5.0まで作成​します。

次にf(x)のデータを作成します。関数は「​=NORM.DIST​」を活用します。左から順に「xの値」「期待値(平均値)」「標準偏差」「FALSE」を入力しましょう。

完成したデータは以下の通りです。

2.グラフを作成する

セルを選択後、「挿入」タブから「グラフ」メニューの「散布図」を選択し、「散布図(平滑線)」を選択します。

すると、上記のような正規分布が完成します。

正規分布の標準化とは

標準化とは、​​正規分布から標準正規分布に変換することです。期待値(平均値)が0で、標準偏差が1のものを「標準正規分布」といいます。正規分布を標準化すると、期待値(平均値)と標準偏差の値が0と1と決まるため、正規分布が1つで済みます。

なお、期待値(平均値)から標準偏差の距離が+1,−1の範囲に、約68%のデータが含まれており、期待値(平均値)から標準偏差の距離が+2,−2の範囲に、約95%のデータが含まれていると言われています。

期待値(平均値)に近いほどデータが多く、期待値(平均値)から遠いほどデータが少なくなるのが特徴です。正規分布の面積が確率を表しますが、標準正規分布では「標準正規分布表」を使用して確率を求めます。

たとえば、t値が1.25だった場合の標準正規分布表の見方は以下の通りです。

まず、一の位と小数点一桁目の数字を縦軸で探していきます。t値が1.25の場合、一の位と小数点一桁目は1.2です。次に、小数点2桁目の数字を横軸で探します。t値が1.25の場合は、0.05を見ます。

最後に縦軸と横軸の2つが交わるところの数値を読み取ると、確率は0.1056ということがわかります。

正規分布と偏差値の関係

偏差値は正規分布の代表的な例です。期待値(平均値)が50、標準偏差が10の正規分布は、偏差値を表す曲線として知られています。

たとえば、自分のテストの点数が期待値(平均値)と同じであれば、偏差値は50です。取得した点数が期待値(平均値)よりも標準偏差1つ分高い場合の偏差値は「50 + 10」で60、2つ分高い場合の偏差値は「50 + 20」で70とわかります。

正規分布のまとめ

正規分布とは、左右対称の釣鐘型・山型の分布です。分散(標準偏差)が大きくなると、曲線の山は低くなり、左右に広がって平らな曲線となります。逆に分散(標準偏差)が小さくなると、高い山となり、頂上がより尖った形になる特徴があります。

「この世でもっとも一般的な分布」と言われており、正規分布を活用するとある現象の発生確率を計算できる可能性が高まります。もっとも発生確率が高いところは期待値(平均値)「μ」で表され、μから距離が遠くなるほど発生確率は低くなります。

なお、期待値(平均値)が0で、分散が1のものを「標準正規分布」と言い、確率は標準正規分布表を使用して確率を求められることも覚えておきたいポイントです。