決定木分析とは|簡単解説

決定木分析のカンタン語句解説
決定木分析とは、ツリー構造でデータを分類していく手法です。ターゲット選定や顧客満足度に影響を与えている要素の発見など、マーケティングの場面でよく活用されています。なお、決定木分析ではデータグループのことを「ノード」と呼び、ノードとノードを結ぶ線を「ブランチ」と呼びます。
決定木分析をわかりやすく解説
決定木分析(デシジョンツリー)を活用すると、目的変数に影響を及ぼしている説明変数を見つけ出すことが可能です。
通常、決定木は1つのノード(データグループ)から始まり、想定しうる結果へと分岐していきます。徐々にノードの数が増えていき、結果として樹木状のモデルが形成されます。
知っておきたい用語
決定木分析を理解するにあたって覚えておきたい用語を解説します。
用語 | 解説 |
ルート(決定)ノード | ツリー構造の起点となるデータグループ |
ブランチ | ノードとノードを結ぶ線 |
チャンスノード | 各ノードから導き出された結果。円形で表示されるのが一般的 |
リーフ(エンド)ノード | 最終結果を表す箇所。三角形で表されるのが一般的。 |
決定木分析の特徴
決定木分析の主な特徴は以下の通りです。
- クロス集計よりも分析が簡単
- データを分類して優先順位がつけられる
- データを可視化できるため理解しやすい
- カテゴリーデータと数値データ問わず分析できる
- いくつかの選択肢から最善のものが選べる
- 他の意志決定支援ツールと組み合わせやすい
- 分岐のプロセスがわかりやすい
設問と設問をかけ合わせて集計する「クロス集計」の場合は、説明変数が見つかり次第何度も集計を繰り返す必要があります。
その点、決定木分析を活用すれば1つのツリー構造で複数パターンを視覚化できるため、大量のデータであっても効率よく分析することが可能です。
また、データの分析方法には向いているデータと向いていないデータがありますが、決定木分析は比較的幅広いデータに対応しています。さまざまなデータを分析でき、汎用性が高いという特徴があります。
決定木分析の注意点
決定木分析の注意点は以下の通りです。
- 変数がカットされていることがある
- 決定木分析が複雑になることがある
- 分岐は逐次的に行われるものである
一部のデータを深掘りしすぎてしまうと、ツリー構造が複雑化してしまい、分析結果の読み取りが難しくなります。反対に分岐の数が少なすぎると、十分な予測ができない場合もあるため注意が必要です。
また分岐は順を追って進行するため、上位に来たノード(分岐点)が下位のデータに影響を与えます。少しの数値差であっても、データは上位にある分岐によって支配されることにも注意をしましょう。
決定木分析の書き方
決定木分析を作成する手順は以下の通りです。
- ルートノードを設定する(目的変数)
- 想定しうる結果へと分岐させる
- 説明変数が見つかり次第チャンスノードを追加していく
起点となるルートノードとチャンスノードは、分析結果に大きく影響する項目であるため、分析したい内容に適した項目を設定することが大切です。
たとえば、商品・サービスのターゲット層を把握したい場合は、性別や年代などの関連性の高い項目から順番に枝分かれさせていきましょう。
マーケティングにおける決定木分析の利用場面
マーケティングにおける決定木分析の利用場面は以下の通りです。
商品・サービスのターゲット層把握
これまでの購買データや行動データ、アンケート結果を決定木分析すると、商品・サービスのターゲットの属性を把握できます。
たとえば、性別や年代、既婚/未婚などのデータを決定木分析すると、「20代の既婚男性」や「スマホを利用している40代女性」などのように、よく自社の商品・サービスを購入している人の属性がわかります。
顧客が離脱する原因の探索
アンケートや購買履歴、顧客情報を分析すると、顧客が離脱する原因の発見にもつながります。
顧客が離脱する原因を把握すると、適切なターゲット選定や商品機能の改善、顧客対応の見直しなどにつながり、顧客満足度の向上にも役立ちます。
顧客満足度に影響を与えている要素の特定
購買履歴や顧客満足度に関するアンケート結果、クーポン利用者データなどを分析すると、顧客満足度に影響を与えている要素を洗い出せます。
これにより優先的に改善すべき点がわかり、顧客満足度の向上につなげることができるでしょう。
回帰分析との違い
決定木分析と回帰分析は、目的変数を予測する分析です。しかし、予測モデルを作るまでの過程が異なります。
回帰分析では「y=ax+b」のような回帰式を用いますが、決定木分析は数式を使わずに分岐のみで表します。
回帰分析は、目的変数と説明変数が比例すると仮定できるため、売上や広告効果、家賃などの予想に効果的です。
決定木分析のまとめ
決定木分析とは、ツリー構造でデータを分類していく手法です。決定木は1つのノード(データグループ)から始まり、想定しうる結果へと分岐していきます。
決定木分析を活用すると、商品・サービスのターゲット層の把握や顧客が離脱する原因の探索などが可能です。
なお、決定木分析を行う際は「Lucidchart」や「GitMind」などのツールを使用すると効率的です。
