クロス集計とは | 簡単解説

クロス集計のカンタン語句解説
クロス集計はカテゴリーデータを2つ以上かけ合わせて集計することクロス集計はアンケート調査の集計方法のひとつであり、1つの質問項目に対する集計結果を、男女別、年代別など、他の質問項目の選択肢ごとに分けて集計することを指します。
クロス集計はカテゴリーデータをかけ合わせて、2つ以上の質問項目の関係を調べる際に使います。
アンケート調査の集計は単純集計とクロス集計にわかれます。単純集計は各質問項目ごとに集計された数値を見るものですが、クロス集計は質問項目を組み合わせて集計を行うことで、単純集計には現れない回答者の傾向を見つけ出すことができます。
単純集計とクロス集計
アンケート調査の集計では、質問項目をアイテム、各質問に対する選択肢をカテゴリーといいます。
回収した調査票を集計する際、最初に行うのが各サンプルのアイテムごとに選択されたカテゴリーを足し合わせることです。これを単純集計(GT表:Grand Total Tabulation)といいます。
単純集計ではアイテムごとに選択されたカテゴリーの数を足し合わせるとともに、回答者全体(n数)に対する各カテゴリーの人数の割合も算出します。
【単純集計表】
Q1.性別をお答えください
全体 | ※※人(100%) |
男性 | ※※人(※※%) |
女性 | ※※人(※※%) |
Q2.当てはまる年代をお答えください
全体 | ※※人(100%) |
10代 | ※※人(※※%) |
20代 | ※※人(※※%) |
30代 | ※※人(※※%) |
40代 | ※※人(※※%) |
50代 | ※※人(※※%) |
60歳以上 | ※※人(※※%) |
Q3.次のブランドのうち知っているものをいくつでもお答えください
全体 | ※※人(100%) |
ブランドA | ※※人(※※%) |
ブランドB | ※※人(※※%) |
ブランドC | ※※人(※※%) |
ブランドD | ※※人(※※%) |
クロス集計はGTで集計された1つのアイテムについて、他の質問項目のカテゴリー別の数値を見る場合に使います。
性別や年代別といった属性情報別の比較を最もよく使いますが、属性情報にかぎらず、他のアイテムのカテゴリーごとに比較を行うことで、アイテムごとの関係性を見ることもできます。
Q.3のブランド認知について性別と年代別にクロス集計を行うと、以下のようなクロス集計表ができあがります。
【クロス集計表】
ブランドA | ブランドB | ブランドC | ブランドD | ||
---|---|---|---|---|---|
全体(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
性別 | 男性(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) |
女性(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) |
ブランドA | ブランドB | ブランドC | ブランドD | ||
---|---|---|---|---|---|
全体(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
年代別 | 10代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) |
20代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
30代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
40代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
50代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
60歳以上(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) |
Q.3のどのブランドの認知度が高いかについて、単純集計では回答者全体のことしかわかりませんが、Q.3とQ.1、Q.3とQ.2のクロス集計を行うことで、性別、あるいは、年代別のブランド認知を比較することが可能になります。
クロス集計の決まりごと
クロス集計を扱う場合には、表の見方や数値の表し方についての作法や決まりがあります。
表頭と表側
クロス集計は2つ以上のアイテムを組み合わせるため、一方のアイテムのカテゴリーを行、もう一方のアイテムのカテゴリーを列とする表としてあらわされます。列で区別されるカテゴリーを表頭、行で区別されるカテゴリーを表側といいます。
度数と割合(構成比)
上に示した年代別のブランド認知のクロス集計表では、表頭・表側に対応した集計結果が入るセルに人数と割合を記入しています。通常は人数の単位は表示せず、人数の数値を度数としてあらわします。パーセントは表側のカテゴリーのn数を100としたときの割合です。
横%表と縦%表
表側のn数を基準に表頭のカテゴリーの割合を示したクロス集計表を横%表といいます。反対に表頭のn数を基準に表側のカテゴリーの割合を示した場合は縦%表となります。
しかし、クロスさせるアイテムのどちらを表側・表頭にするかは任意に決めることができるため、通常は表側を基準にした横%表とするのが一般的です。
説明変数と目的変数
横%表のクロス集計を行う目的は表側にとったカテゴリーごとの表頭のカテゴリーの度数と割合を見ることです。この場合の表頭のカテゴリーを目的変数、表側のカテゴリーを説明変数と呼びます。
上の年代別のブランド認知のクロス集計表では、年代別のブランド認知を明らかにする目的でクロス集計を行ったので、年代別のそれぞれのカテゴリーが説明変数、ブランドのカテゴリーが目的変数ということになります。
クロス集計の種類
上で見たクロス集計の例は、Q.3のブランド認知についてQ.1性別とQ.2年代別という属性情報を聞いたアイテムをクロスさせたものですが、属性情報以外のアイテム同士をクロスさせることも行われますし、3つ以上の変数をかけ合わせることもできます。
属性情報以外のアイテム同士のクロス集計
属性情報以外のアイテムを組み合わせることで、新たな発見につながるケースもあります。
例に示したQ.1~3に加え、ファッションの志向性を5つのカテゴリーで聞くQ.4のアイテムを加えるとします。
【単純集計】
Q.4 あなたが好ましいと思うファッションを次のなかからいくつでも選んでください
全体 | ※※人(100%) |
モード | ※※人(※※%) |
シック | ※※人(※※%) |
トラッド | ※※人(※※%) |
スポーティ | ※※人(※※%) |
カジュアル | ※※人(※※%) |
Q.3とQ.4をかけ合わせたクロス集計を行います。
【クロス集計】
ブランドA | ブランドB | ブランドC | ブランドD | |
---|---|---|---|---|
全体(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) |
モード(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) |
シック(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) |
トラッド(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) |
スポーティ(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) |
カジュアル(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) |
上の例では、ファッションの志向性の違いによって、どのブランドの認知度が高いのかがわかります。
多重クロス集計
性別と年代別のブランド認知についてのクロス集計表を例示しましたが、性別ごとに年代別のブランド認知の違いを集計することもできます。3つ以上の変数を組み合わせたものを多重クロス集計といいます。
ブランドA | ブランドB | ブランドC | ブランドD | ||
---|---|---|---|---|---|
全体(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
男性(n=※※) | 10代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) |
20代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
30代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
40代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
50代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
60歳以上(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
女性(n=※※) | 10代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) |
20代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
30代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
40代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
50代(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | |
60歳以上(n=※※) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) | ※※人(※※%) |
クロス集計を行う際の注意点
クロス集計は、単純集計の結果である各カテゴリーのn数を他のアイテムのカテゴリーで分割していくことになるため、クロスを多重にするほどセルに入る度数は小さくなっていきます。
アンケート調査では集計した結果の数値を全体を代表するものと考えていいかどうかが問題となります。
クロス集計した際に表側のカテゴリーのn数が小さければ、表頭のカテゴリーごとの度数はさらに小さい数値となり、その数値に代表性を求めていいかどうかが問われます。
さらに、小さいn数に対する割合を求めた場合、度数が1変わることで構成比は大きく変動します。表側のカテゴリーのn数が30未満の場合は、クロス集計を行った結果の数値について慎重に判断する必要があります。
クロス集計は、アイテム同士のかけ合わせであるため、アイテム数とカテゴリー数が多い場合には、膨大な数値の組み合わせができあがります。
多くの場合、アンケートの集計に特化したアプリケーションソフトを使って集計を行いますが、出力されるクロス集計表が膨大な数になってしまい、数値の解釈や分析に混乱をきたすことが往々にしてあり得ます。
明らかにすべきテーマを明確にし、仮説を持った上でクロス集計を行うことが、集計データを読み解いていく際の重要なポイントです。
クロス集計は単純集計と並ぶ集計の基本
単純集計とクロス集計は、足し合わせと割合で算出されるアンケート調査を集計する際の基本的な集計方法です。数値をどう解釈し意味のある情報を見つけていくかという点で、クロス集計はリサーチャーのセンスとインサイトが問われる作業です。
クロス集計について、さらに解説を知りたい方はこちらの記事をご覧になってください。