母集団とは|簡単解説
母集団のカンタン語句解説
統計学において、「母集団」とは調査の対象となる集団全体を指します。一方、「標本」とは、母集団の一部であり、観測可能な部分のことです。特に母集団が大きくなる調査では、母集団全体を調査することが困難であるため、標本を選び、標本から得られたデータを元に母集団全体についての情報を推測します。
母集団と標本の違い
統計学において、「母集団」とは調査の対象となる集団全体のことです。一方、「標本」とは、母集団の一部であり、観測可能な部分を指します。
統計学では、標本から得られた観測データを元に、母集団の性質や特徴を明らかにします。
たとえば、ある店の来店客調査を考えてみましょう。
この場合、その店の来店客全体が母集団となります。しかし、全ての来店客を対象に調査を行うのは、調査の効率性やコストの面などから困難な場合があるでしょう。そこで、母集団から一部の人々を選び出し、調査対象とします。この調査対象の一部が標本です。
母集団から標本を抽出する方法
母集団から標本を抽出する方法は、大きく有意抽出法と無作為抽出法の2つに分けられます。ここでは、それぞれの抽出方法を詳しく解説します。
有意抽出法
有意抽出法は、代表的な性質を持つ対象を選び、それを標本として抽出する方法です。少ない標本数でも調査可能で、インタビューなどで的確な意見を集める際に有効です。しかし、客観性が欠け、標本誤差を統計的に計算できない注意点もあります。
無作為抽出法
無作為抽出法はランダムに調査対象者を選ぶ手法です。乱数や名簿を利用し、母集団から無作為に標本を抽出します。統計的に標本誤差を計算でき、客観性に優れている特徴があります。
その他の代表的な抽出方法
その他、以下のような抽出方法があります。
抽出方法 | 解説 |
---|---|
層化抽出法(層別抽出法) | 母集団を複数の層(グループ)に分け、各層から必要な数の調査対象を無作為に抽出する方法です。 <例>男女比が4:6の企業で、10人の従業員を対象に調査を行う場合、男性4名と女性6名を無作為に抽出する。 |
クラスター抽出法(集落抽出法) | 母集団を小集団である「クラスター(集落)」に分け、その中から無作為抽出でいくつかのクラスターを選ぶ方法です。選ばれた各クラスターにおいて全数調査を行います。 <例>大学生の平均勉強時間を調査する場合、大学をクラスターと考え、全国の大学からランダムに5校を選び、選ばれた5校全ての大学生の平均学習時間を測定する。 |
多段抽出法 | 母集団を複数のグループに分け、それらのグループから無作為抽出で一部のグループを選び出します。さらにその中から無作為抽出で一部のグループを選ぶ操作を繰り返し、最終的に選ばれたグループから調査対象を無作為抽出する方法です。 <例>全国の都道府県をグループとして考え、まずいくつかの都道府県を無作為抽出。その中からさらにいくつかの市町村を無作為抽出。そして、抽出された地区の中からそれぞれ◯人を無作為抽出する |
系統抽出法 | 最初の調査対象を無作為に選び、その後は一定の間隔で調査対象を抽出する方法です。 <例>・10,000人から3,000人を選ぶ場合、通し番号を付けた名簿を用意し、ランダムに選ばれた番号から3人おきに抽出する。 |
アンケート調査における母集団の決め方
母集団の選定は調査の信頼性や有効性に影響を与えるため、慎重に行う必要があります。
まずはアンケート調査の目的を考え、対象となるユーザーを明確に定義しましょう。
たとえば、自社サービスの満足度を知りたい場合は全ユーザーが対象となります。商品をリピート購入した理由を知りたい場合は、「同じ商品を◯回以上購入した人」のように条件を定め、その条件に合った人を母集団に設定する必要があります。
母集団から抽出する人数を求める方法
アンケートで得られる結果には、母集団全体を調査しない限り必ず誤差が生じます。この誤差の程度を評価する指標が、許容誤差と信頼水準です。
ここでは、許容誤差と信頼水準を用いた標本の抽出方法を詳しく解説します。
1.許容誤差と信頼水準を決める
母集団の全員に調査を行わない限り、アンケートで得られる結果には必ず誤差が生まれます。このような誤差の程度の指標として、「許容誤差」と「信頼レベル」があります。
許容誤差は、標本調査で得られた結果と、母集団全体を調査した場合の結果の「誤差の範囲」を示します。一方で信頼水準は、許容誤差内の結果を得られる確率のことです。
一般的に、許容誤差が5%で信頼水準が95%以上であれば、統計的に有意な結果とされます。これらの指標を考慮して、適切なサンプルサイズを求めます。
参考記事
標本誤差とは|簡単解説
標本誤差とは、標本を使って母集団を推測する際に生じる誤差のことです。標本誤差の大きさは抽出数が多いほど小さくなり、母集団内の個別データのばらつきが少ないほど小さくなります。標本誤差は、標本調査において起こる誤差であり、全数調査には存在しません。
詳細はこちらの記事をご覧ください
2.サンプルサイズを決める
精度の高い調査を希望する場合、できるだけ多くのサンプル数を確保する必要があります。
たとえば、信頼水準95%のアンケート調査では、母集団が10万人以上なら許容誤差5%で383、3%で1,056、1%で8,763程度のサンプル数が必要です。
さらに属性別でも信頼水準を保ちたい場合は、それぞれの属性別に、サンプルサイズを確保する必要があります。
なお、サンプル数は計算ツールを使用して求められます。
3.アンケートの配布数を決める
予想される回収率と必要なサンプル数を考慮し、実際のアンケート配布数を計算します。
アンケートを配布する際は、全員が回答してくれるわけではないことを加味する必要があります。
なお、回収率は送付したアンケートに対する回答の割合です。たとえば、1,000人にアンケートを送付して100人が回答した場合、回収率は10%となります。
平均的な回収率は約30%とされており、たとえば必要なサンプル数が400人で予想回収率が30%の場合、実際には1,350人にアンケートを配布する必要があるでしょう。
まとめ
母集団は、全国の大学生や企業の従業員などの全体の集まりを指します。しかし、特に母集団が大きくなるような調査だと、効率面やコストなどの観点から母集団全体を調査するのは困難です。その場合は標本を抽出し、母集団全体の特性や傾向を推測・予測します。
クロス・マーケティングのQiQUMO(キクモ)は、自分で操作できるインターネット調査ツールです。アンケート画面の作成や回答の収集が自分で行えるため、効率よく調査を進められます。
また、約541万人のパネルの中を属性情報で絞り込んで調査を行うことも可能です。スピーディかつ費用を抑えたい方は、ぜひ一度お試しになってください。