因子分析とは|簡単解説
因子分析のカンタン語句解説
数多くある変数の中から、少ない変数で説明するための統計学上のデータ解析手法です。「多変量解析」の分析手法のひとつであり、解析によって導かれた内容から、影響度の強い因子の発見が可能。因子とは、何らかの結果を引き起こす原因を意味します。因子=原因であることから、原因を探す分析手法ともいえます。
因子分析をさらに解説すると、取得したデータが持つ複数の要素(各変数)の中から、共通している因子を探し出す分析手法です。
多数のデータをひとつ一つ分析して因果関係を見つけることが困難な場合、因子分析を用いることで、少ない因子の分析によりデータの構造を把握し、消費者や回答者の行動にある背景を見つけることができます。
因子分析をカンタンに理解する例
わかりやすい例として、国公立大学受験を思い浮かべてください。
国語、英語、歴史、数学、物理、化学の試験科目において、個々の科目の点数を分析するのではなく、共通因子として、国語と英語と歴史を文系、数学と物理と化学を理系と集約します。
共通する因子にまとめることで、文系の能力は■■点/理系の能力は□□点という分析結果を得ることができるのです。
このように因子分析を用いることで、たくさんある変数を少数の因子(潜在変数)に要約することで、確からしい分析結果を得ることにつながります。
潜在変数への反応から、個々の回答者(ユーザーや属性グループ)の意識や行動の違いを明確化できます。特定の商品カテゴリに属するユーザー評価から、購買に結びつく評価要因を抽出して、それらの志向性においての自社の位置付けを把握することが可能です。
因子分析の実例
因子分析は、データが持つ複数の変数から共通する因子をみつけることで、行動の背景を探ることができます。先述した大学受験のテストをベースに実例を挙げてみましょう。
数学、物理、化学、英語、国語、歴史のテスト結果(点数)データがあります。
「数学の点数が高い人は、物理や化学の点数が高い」「国語の点数が高い人は、英語や歴史の点数が高い」という大雑把な傾向が見えたとしましょう。この結果から、どの科目とどの科目がどの程度の関係性を持っているかはわかりません。
因子分析を行なうために、「それぞれの科目の点数に共通する要素がある」と仮説を立ててグルーピングをした結果が以下の図になります。
因子分析の結果から、大きくふたつの共通因子が存在するという発見ができます。因子Aは「数学」「物理」「化学」「英語」が共通する「理系の能力」、因子Bは「英語」「国語」「歴史」が共通する『文系の能力』と命名します。
因子分析を進めていくと、各因子がどの程度の共通なのかを算出することが可能です。
能力名から科目名に伸びている線に振った数字は、共通因子の関係性の強さを表現しています。また「独自因子」という、他の変数とは共通しない因子を有しています。
化学の数値を取り上げると、化学の成績は「理系能力+化学の独自因子」の合計で構成されているということ。
上記の図から結果を読み解くと、理系の能力は「数学」「物理」「化学」が強い影響を持ち、「英語」が小さいながらも影響していることがわかります。文系の能力においては、「国語」「英語」「歴史」の順番に強く影響を与えているということです。
ここで計算は省きますが、因子分析の結果を用いることで、全受験生のテスト結果から「理系の能力」「文系の能力」に分類することができます。
個々のテスト結果(点数)を比較するだけでは、どの受験生がどのような能力を有するのかという比較に困難があります。そこで因子分析によって共通因子を数値化することで、比較が容易になるというのが最大のメリットです。
因子分析の概念
因子分析は、教育心理学において生徒の能力を測るために考え出されました。生徒に複数科目のテストを受けてもらった結果、各教科の点数を眺めてみても、不明点が存在します。
同じ生徒なのに、科目によって点数に差があること、どうやら得意科目や苦手科目がありそうなこと。点数の高低によって事実はわかりますが、その背景や要因を把握することはできません。
そこで、生徒の各教科の成績を全体として分析することで、点数からは読み解けない個人の能力における共通因子を見つけることで課題にアプローチしました。
共通因子とは、「発想力」「読解力」「計算力」「説明力」「語彙力」「想像力」「思考力」「判断力」「表現力」などです。
各テスト結果から、共通因子の大小や組み合わせを導き、各科目の固有要因である「独自因子(特殊因子)」による説明を可能としました。
もともとは教育心理学の分野で使われていた手法が、経済学や医学などの学問で利用され、ビジネスシーンではマーケティングリサーチの分析で活用されているのです。
因子分析についてもっと知りたい方はこちらをご覧ください
マーケティングリサーチでの活用
因子分析について、マーケティングリサーチ場面での利用シーンを紹介すると、アンケートを実施した後の結果分析において、回答者の潜在意識や言葉にできない意思を見出す目的で用いられます。
アンケート調査で得られた回答データは、「属性別(性別、年齢・世代、最終学歴、職業、住居、年収、世帯年収、居住地域など)」「ユーザー・ノンユーザー別」「サービス利用の有無」「認知の有無」など細分化して、マーケティング戦略に利用します。
多くのデータを収集するために質問項目/選択肢を複数用意した場合、分析や報告レポートの作成に大きな手間となるでしょう。精緻なデータを取得すればするほど、後工程が煩雑になり、調査結果を活用しにくいというジレンマが発生します。
そこで活用されるのが因子分析。数多くの説明変数データの中から、潜在的な共通項を見つけ出し、同じ意味のグループに分類・集約する「多変量解析」と呼ばれる分析手法です。
多変量解析は、大きくふたつの手法に分けられます。
- A:目的変数(外的基準)と説明変数(内的基準)の因果関係を明らかにする手法
- B:質問項目や回答した対象者の整理、分類、類似度を明らかにする手法
Aを「目的変数(外的基準)のある手法」、Bを「目的変数(外的基準)をもたない手法」と表現します。
因子分析は、Bの「目的変数(外的基準)をもたない手法」であり、多くの説明変数を分類し、それぞれの分類された同じ意味合いをもつグループの項目間の中での影響度の強さを明らかにする手法です。
因子分析の際に注意したいこと
マーケティングリサーチの場面でアンケート調査を実施したものの、あまりに多くの設問数を設けすぎて、回答の整理が難航しているとき。因子分析を取り入れることで、データを集約することで因子の数を減らしながら、課題解決につながる分析を実行しやすくなります。
ただし100%万能ではなく、以下の点には注意が必要です。
分析者の主観で設定する必要がある
因子数や因子の名前、因子軸の回転方法は、分析する人が自己判断で設定します。分析前の仮説に基づいて設定しますが、分析結果の解釈が難しい場合には、因子の数を増減させたり、回転方法を変更するなどの工夫が必要です。
分析者の主観によって結果の読み解き方が異なるため、誰が因子分析を実施しても、同一のアウトプットになるわけでないことを理解しておきましょう。
また、因子の名前についても、分析を担当する人が自己の解釈において命名します。分析前の因子項目を理解・網羅して、分析結果を共有する相手にとっても納得できる名前をつけるセンスが必要です。