多次元尺度構成法とは|簡単解説
多次元尺度構成法のカンタン語句解説
多次元尺度構成法は複数のデータ同士の類似度を距離として表し、距離をもとにしたデータ間の相対的な位置関係をマップ空間上に描く手法です。マーケティング領域では、得られたデータをポジショニングマップに可視化してインサイトを探索するために用いられます。
多次元尺度構成法の概要
多次元尺度構成法(MDS:Multi-Dimentional Scaling)は統計解析にコンピュータが用いられるようになってから発展してきた統計手法です。MDSには計量(メトリック)MDSと非計量(ノンメトリック)MDSがあり、データの尺度水準によって使い分けられます。
特に順序尺度のデータから距離を計算できる非計量MDSは、人間の感覚や心理的要素を扱うマーケティングをはじめとした社会科学分野で広く活用されています。
MDSを使ってデータ分析を行う際には、統計解析の専用アプリケーションソフトを使うことが一般的であり、エクセルなどのスプレッドシートでは距離行列の作成や座標の計算に手間がかかります。
MDSは多変量解析のひとつ
MDSは多変量解析の分析手法のひとつです。多変量解析とは、複数の変数(変量)の情報を要約することで、似ているものを分類してグループ化したり、変数同士の影響を明らかにしたり、少ない次元の空間に表現したりする分析手法の総称です。
変量を要約する手続きとしては以下の5つが挙げられ、それぞれに使われる分析手法が異なります。
①変数群から少数を選ぶ | AID分析(決定木)、CAID分析(多肢層分析) |
②変数群から新しい変数を作る | 因子分析、主成分分析 |
③距離に換算する | 多次元尺度構成法、クラスター分析 |
④変数を分類する | 重回帰分析、判別分析 |
⑤変数に数量を与える | 分散分析、コンジョイント分析 |
多次元尺度構成はデータの類似性を距離に置き換え、似ているものを近くに、似ていないものを遠くにプロットして相対的なデータの構造を空間上に表します。
MDSの活用例
マーケティングリサーチにMDSを用いる場合、選好や評価に関するデータを使って、ブランドイメージや製品のポジショニングを2次元マップに視覚化します。
プロダクトマップ
製品の類似性をプロフィールや特性の観点からマップ上に視覚化したものを指し、自社と競合間、または、自社の製品群について特定の評価軸をもとにした位置づけを表します。
知覚マップ
製品やブランドに対する消費者の認知の仕方を明らかにすることを目的とし、消費者側の製品やブランドに持つイメージや評価を手がかりとしたポジショニングを行います。
MDSの考え方
MDSでは類似性を距離に置き換えてマッピングを行うと述べましたが、相互の距離の情報から位置関係を相対的に表すことができます。
MDSの説明として使われることが多い地理的な距離のデータから、地図を描く一例を挙げます。
以下は、ヨーロッパの各都市間の距離のデータです。
上記の都市間の距離を入力データとし、MDSで分析を行うと以下の座標データが得られます。
上記の座標データは統計解析フリーソフトRのcmdscaleという関数を使って求めたものです。求められた2次元の座標値から下のような2次元マップが描かれます。
2次元マップに描かれたヨーロッパ各都市の位置関係はこのままでは地図と一致しません。しかし、横軸を中心軸として裏返した場合、地図と一致する正確な位置関係にはないものの、各都市の方向感と距離感は概ね表していると見ることができます。
このように、MDSでは変数やデータ間の距離を手がかりに相対的な位置関係を表すことを目的としており、軸の設定や解釈は分析者の判断に委ねられます。
MDSを使うためのデータと手続き
MDSは入力データに距離行列を用います。距離行列とはN✕Nのマトリックスで表されるデータです。
距離は比例尺度で表される物理的な距離以外にも、順序尺度で表される「似ている度合い」や「関連する度合い」を数値化して距離とすることができます。
距離として用いるデータは以下の距離の公理を満たしている必要があります。
- 非負性:距離は正の値を取る
- 同一性:始点と終点が一致する場合は0
- 対称性:始点と終点を入れ替えても値は変わらない
- 三角不等式が成立する:任意の3つのベクトルに対し三角不等式が成り立つ
また、距離にはユークリッド距離(いわゆる距離)のほか、マンハッタン距離(座標の絶対値の総和)やバイナリー距離(0と1で異同を表す)などが用いられます。
上記を満たすデータから距離行列を作り座標を求めることでマッピングすることができます。
距離行列から座標を求めるには固有値分解という線形代数の方法を使った計算を行います。実際には統計解析ソフトに入力データを指定することで直接二次元マップを描きます。
計量的MDSと非計量的MDS
扱うデータの尺度水準によって距離行列から座標を求める際に使われる方法が異なります。ユークリッド距離のように比例尺度で得られるデータを扱う場合を計量的MDSといいます。
それに対し、ブランド選好やイメージ評価などを評定尺度や順位付けで測定したデータは、大小関係や順序関係しか持っていません。このような順序尺度として得られたデータを用いるのが非計量的MDSです。
非計量MDSは計量MDSと比較すると以下の点が異なります。
- 類似度と距離は順序関係(単調関係)さえ満たせばよい
- 線形関係を満たす必要はない
ストレス値
非計量MDSでは測定データから得られた非類似度と実際の距離の大小関係を満たすように座標を決定します。このときの距離とデータの大小関係の当てはまる度合いをストレス値といい、ストレス値の値が小さいほど再現性が高いと評価します。具体的には以下の数値を用います。
ストレス値 | 評価 |
---|---|
0.2 | poor(悪い) |
0.1 | fair(まずまず) |
0.05 | good(よい) |
0.025 | excellent(すばらしい) |
0.00 | perfect(完璧) |
その他のMDS
MDSにはデータの何を距離と見なすかによって、さまざまなバリエーションが開発されており統計解析ソフトで使うことができます。
回答者が複数の対象を評価した2相3元データを用い、回答者の特徴を重み付けすることで個人差を表現する個人差MDS(INDSCAL:インスカル)や、距離の定義に当てはまらない非対称なデータを空間を拡張することで表現する非対称MDSなどがメジャーなところです。
幅広く活用されるMDS
MDSは応用性の高いデータ解析手法であり、マーケティング分野を始めとして認知心理学や公共政策分野などでも幅広く活用されています。
実際に活用するに当たっては統計解析ソフトを使って何ができるかを学んでいくことがMDSを理解するための早道です。また、多変量解析に共通して統計や数学に関する基礎知識も必須であることから、段階を踏んで知識を身につけていくことも必要です。