平均値とは|簡単解説
平均値のカンタン語句解説
平均値は基本統計量のひとつであり、中央値、最頻値とともにデータ全体の中央傾向を代表する統計量です。平均値はデータの総和をデータの個数で割ることで求められます。
平均値の概要
平均値は求め方が簡単なこともあり、さまざまな場面で目にすることの多い統計量です。しかし、平均値は集団の特徴の一部分をあらわす数値に過ぎないため、他の基本統計量と合わせて見ることが重要です。
集団の中央付近をあらわす数値は、平均値のほか中央値、最頻値があります。平均値・中央値・最頻値は特徴をひとつの値であらわすために使われます。これらの数値を代表値といいます。
集団の特徴はデータのバラつきの様子によっても異なります。分散や標準偏差、四分位数を使ってデータ全体のバラつきの度合いを把握します。これらをすべて含めて基本統計量といいます。
平均値、中央値、最頻値の違い
平均値、中央値、最頻値を例を使って解説します。
平均値
以下の数値を100人分のテストの点数とします。
54点、58点、62点、66点、58点、61点、62点、64点、64点、63点、 61点、 57点、 61点、 56点、 64点、 65点、 53点、 63点、 56点、 66点、 63点、 62点、 57点、 67点、 68点、 63点、 62点、 60点、 61点、66点、53点、65点、 62点、 60点、 63点、 64点、 66点、 62点、 54点、 64点、 55点、 52点、 65点、 63点、 56点、 63点、 56点、 58点、 65点、 54点、 60点、 61点、 65点、 61点、 59点、 60点、 63点、 65点、64点、 59点、 59点、 68点、 66点、 67点、 51点、 59点、 67点、 60点、 60点、 62点、 70点、 61点、 54点、 58点、 61点、 64点、 64点、 63点、 65点、 58点、 63点、 63点、 57点、 63点、 62点、 55点、 62点、57点、 61点、 60点、 58点、 60点、 59点、 63点、 67点、 63点、 59点、 56点、 61点、 64点 |
平均は、データの総和をデータ数で割ることで求められます。すべてのデータの総和を求めると6,110、データ数は100なので、100人のテストの点数の平均は61.1点となります。
エクセルでは関数「=AVERAGE」を使って求めることができます。
中央値
中央値はデータを大きさの順番で並べた場合の中央に位置する値のことです。上記の100人分のテストの点数を昇順に並べ替えると以下のようになります。
51点、 52点、 53点、 53点、 54点、 54点、 54点、 54点、 55点、 55点、 56点、 56点、 56点、 56点、 56点、 57点、 57点、 57点、 57点、 58点、 58点、 58点、 58点、 58点、 58点、 59点、 59点、 59点、 59点、59点、 59点、 60点、 60点、 60点、 60点、 60点、 60点、 60点、 60点、 61点、 61点、 61点、 61点、 61点、 61点、 61点、 61点、 61点、 61点、 62点、 62点、 62点、 62点、 62点、 62点、 62点、 62点、 62点、63点、 63点、 63点、 63点、 63点、 63点、 63点、 63点、 63点、 63点、 63点、 63点、 63点、 63点、 64点、 64点、 64点、 64点、 64点、 64点、 64点、 64点、 64点、 65点、 65点、 65点、 65点、 65点、 65点、 65点、 66点、 66点、 66点、 66点、 66点、 67点、 67点、 67点、 67点、 68点、 68点、 70点 |
データの数は100個であり、大きさの順番で並べた場合の真ん中は50番目と51番目の間に当たります。データ数が奇数の場合は両端から数えてちょうど同じ順番になるデータがありますが、データ数が偶数の場合は両端から数えて同じ順番にあたるデータを合計して2で割った数値が中央値となります。
上記の場合の小さい方から50番目、大きい方から50番目の値はともに62であり、中央値は62となります。
エクセルでは関数「=MEDIAN」を使って求めることができます。
最頻値
最頻値はデータの取る値が最も多いものを指します。この例では63が14個で100個のうち一番多いデータです。
エクセルでは関数「=MODE」を使って求めることができます。
代表値を用いる場合の注意点
上記で求めた平均値・中央値・最頻値を図であらわすと以下のようになります。
この例では、頂点を少し右側に寄せた山型の度数分布表が描かれます。一般的にあらゆる観測データは山型に分布する傾向がありますが、山の形は観測対象によってさまざまなケースがあり、それによって 代表値の取る値も変化します。
平均はデータの個数が少ない場合や外れ値が存在すると大きく変動するため、データ全体を評価する場合には、平均値・中央値・最頻値の値を見るほかに、最小値・第1四分位数・中央値(第2四分位数)・第3四分位数・最大値の5数要約の値も参照する必要があります。
いろいろな平均
平均にはさまざまな種類があり、上記で求めた平均値は算術平均や相加平均といわれるものです。これ以外には以下のような平均値の求め方があります。
相乗平均(幾何平均)
足した数で割る相加平均に対して、かけた数で割るのが相加平均です。相乗平均は幾何平均ともいいます。
相乗平均 = n(a1 ✕ a2 ✕ a3✕ ・・・✕ an) |
相加平均は伸び率や成長率、利回りといった変化率の平均を求める場合に使います。
エクセルでは関数「=GEOMEAN(配列)」を使って求めることができます。
調和平均
調和平均はデータの逆数の相加平均の逆数です。
調和平均 = n1a1+1a2+1a3+・・・1an |
調和平均は速度や人口密度、電気抵抗の平均などを求める場合に使われる平均値です。
エクセルでは関数「=HARMEAN(配列)」を使って求めることができます。
平方平均(平均平方、二乗平均平方根、RMS:Root Mean Square)
平均平方は各データの2乗の相加平均の平方根を取ることで求めます。
平方平均 = a12 +a22 +a32 +・・・+an2n |
物理学や電気工学、製造業の品質管理などで使われる平均値です。
また、各データと平均値の差を2乗して合計したものを平方和といい、平方和をデータの個数で割ると分散が求められます。
エクセルでは関数「=SUMSQ(配列)」を使って求めます。
一般化平均(べき平均、ヘルダー平均)
相加平均と相乗平均、調和平均の3つの平均はピタゴラス平均ともよばれます。そして、この3つの種類の平均を一般化したものが一般化平均です。
一般化平均 =(1ni=1nxip)1p |
上記の式でpが以下の値を取る場合に、それぞれの平均値をあらわします。
p = ー1 :調和平均
p = 0 : 相乗平均
p = 1 : 相加平均
p = 2 : 平方平均
また、p = ー∞ の場合は最小値をとり、p =+∞の場合は最大値となります。
刈込み平均(調整平均、トリム平均)
刈込み平均はデータの大きさで並べ替え、値の大きい方と小さい方の一定割合を無視し、残ったデータの相加平均を求めたものです。
外れ値や異常値をあらかじめ取り除いてもとめた相加平均であり、最小値側と最大値側からどれだけの割合のデータを取り除いたかをあらわす「〇%刈込み平均」といった表現で用いられます。
エクセルでは関数「=TRIMMEAN(配列,割合)」を用います。
加重平均(ウェイト平均)
異なる個数や割合を持つグループの平均を求める場合に、データのグループの個数や割合に応じた重みづけを行って相加平均を求める方法です。
相加平均はすべてのデータの重みを1/nとした加重平均と考えることができます。
詳しくは「ウェイト平均(加重平均)とは|簡単解説」をご覧ください。
移動平均
主に時系列データについて、基準とする時点から一定の範囲の平均を求める方法です。株価や為替相場など時間的に変化するデータのトレンドを見る場合に用いられます。移動平均の具体例としては株価チャートの5日平均線や25日移動平均線がよく知られています。
まとめ
平均値はデータを要約するための基本的な統計量ですが、他の代表値や基本統計量と合わせて、データ全体の特徴を見極めることが重要です。また、平均値は相加平均以外にもさまざまな求め方があるため、目的に応じた平均値を使い分ける必要があります。