生成AIの進化は目まぐるしく、以前は実用に耐えないと見られていた領域でも、いまでは十分に活用を検討できる段階に入っています。これまで、アンケート業務のなかでの生成AIの活用方法をいくつか紹介してきましたが、質問文のバリデーションや自由回答の要約など、テキストの処理を対象とするものでした。最新のAIモデルはデータ分析の性能も大幅に向上しており、複雑な計算や数値データの処理においても高い実用性を発揮するようになっています。今回は、アンケート業務のなかの定量データ部分の処理を中心に、生成AIを使ったローデータのデータクリーニング、単純集計表の作成、集計結果の解釈と分析を行う方法について解説します。1. ローデータの品質確認とクリーニングローデータとは、アンケートのサンプルごとの回答結果をデータテーブルに記録したもので、アンケート集計のもととなるデータのことです。ローデータは表側に回答者ID、表頭に質問項目を配置し、1行に1サンプル分の回答結果を記録したものです。多くのアンケートツールでは、集計結果の表示と合わせてローデータを取得することができ、これをもとにデータの加工・集計・分析を行います。1-1.個人情報などへの配慮自社の顧客や従業員を対象としたアンケートの場合、氏名やメールアドレスなどの個人情報が回答結果に含まれる場合があります。これらの情報がローデータに含まれた状態で生成AIに渡すことは、情報が学習データとして蓄積・流出したり、法令や社内規定に違反するリスクを伴います。個人情報のほか、公開前の製品情報などの社外秘のデータに関するものも同様で、これらが含まれていないかを必ず確認し、項目全体の削除やダミーデータに置き換えるなどの作業を行っておきます。1-2.データチェック・データクリーニングローデータを取得した段階では、不誠実な回答の混入、回答条件の設定や質問文の不備など設計段階での誤りがあった場合、そのまま集計してしまうと正しい結果が得られなくなってしまいます。これに加え、紙で取ったアンケートの場合を想定すると、ローデータの作成に人手が加わるため、転記ミスなどの可能性も想定する必要があります。従来、ローデータの品質を担保するためのデータチェックは人手を使って行っていましたが、これらの作業に生成AIを活用することができます。アンケートツールを使う場合は、入力必須設定や入力制限、条件分岐の制御など、回答段階でデータの欠損・異常・矛盾などが生じない設定ができること、またデータテーブルへの転記によるミスは起こらないため、不誠実回答のチェックが主な作業になります。セルフ型アンケートツールQiQUMOで実施したアンケート調査の例をもとに、生成AIの使い方を見ていきます。【ケーススタディ】総合型フィットネスクラブが、会員層の若返りのためのマーケティング戦略立案を企図して実施したアンケート調査の具体例です。20~40代の世代を対象に、A(活動)、I(興味・関心)、O(価値観)の観点から質問項目を作成しています。<調査企画>■調査目的若年層を中心とした現役世代のライフスタイルを多角的に分析し、会員構成の若返りを促進する効果的なマーケティング戦略の立案と、世代のニーズに応える新規サービス開発に活用することを目的とする。■サンプル回収数と割り付け合計:600(男性:300、女性:300、20代:200、30代:200、40代:200 )■質問項目と選択肢Q1.次の各項目について、あなたご自身の考え方や行動にどの程度当てはまるかを5段階でお答え下さい。【単一選択マトリクス】Q1-1.私は毎週、定期的に運動やトレーニングをする時間を確保している。Q1-2.新しいテクノロジー製品やアプリが出たら、まず自分で試してみる方だ。Q1-3.友人や家族と過ごす時間をとても大切にしている。Q1-4.流行やトレンドには敏感な方だと思う。Q1-5.買い物の際には、価格やコストパフォーマンスをよく検討してから購入する。非常に当てはまるやや当てはまるどちらとも言えないやや当てはまらないまったく当てはまらないQ2.以下の中で、あなたが継続的に行っている趣味・活動をすべて選んでください。【複数選択】スポーツ・運動(ジム通い、ジョギング等)読書・自己啓発ゲーム・アニメ鑑賞旅行・アウトドアボランティア活動・コミュニティ参加音楽・芸術鑑賞その他()Q3.あなたが人生で最も大切にしている価値観は何ですか?以下の項目から優先順位の高い順に3つまで選んでください。【ランク付け】自分らしさの表現心身の健康家族や友人との絆経済的な安定新しい体験や刺激Q4.普段のライフスタイルで大切にしていることについて、自由にご記入ください。【自由入力:複数行】上記の調査企画と調査結果のローデータをプロンプトに追加し、データチェックと調査結果のサマリーの出力を生成AIに指示します。【プロンプト】このローデータを読み込み、まずは分析ではなくデータチェックをしてください。以下を出力してください。1. レコード数・列数2. 管理列、属性列、評価項目、複数回答、順位付け、自由記述の分類3. 欠損・未選択の扱い方4. 単純集計に進めるかどうかの判断5. 単純集計前の一次サマリー推測ではなく、データ構造に基づいて整理してください。【出力(ChatGPT)】今回のローデータから、最初に出すべき具体的アウトプット今回の添付ローデータを見る限り、最初のアウトプットはこうなります。1. データ受領サマリーレコード数: 600列数: 30完了フラグ: 全件完了(600/600)言語: 日本語のみ端末: SP 464件、PC 136件性別: 男性300、女性300年代別: 20代200、30代200、40代200ここまでで、回収条件はかなり整っていると判断できます。 少なくとも、性別×年代の割付はきれいに揃っています。2. 変数の分類今回のデータは、概ね次の構成です。管理列: id アンケートID 案件名 回答者ID 割付 完了フラグ 言語 端末種類属性列: 性別 年齢 年代別 居住地 職業5段階評価: 5問・定期運動時間の確保・新テクノロジーをまず試す・友人や家族との時間を大切にする・流行やトレンドに敏感・価格やコスパをよく検討する複数回答: 7項目・スポーツ/運動・読書/自己啓発・ゲーム・アニメ鑑賞・旅行/アウトドア・ボランティア/コミュニティ参加・音楽/芸術鑑賞・その他自由記述補助列: その他(具体的にご記入ください)順位付け: 価値観の1位・2位・3位自由記述: 1問3. クリーニング上の判断このデータでは、最初に次の判断を明示しておくべきです。完了フラグ=1 なので、全件を分析対象としてよい複数回答項目の NaN は未選択であり、欠損ではないその他(具体的にご記入ください) の欠損率が高いのは自然自由記述は 約20.2%が入力あり自由記述には「なし」「特になし」「ない」が多く、テキスト分析時に除外ルールが必要4. 単純集計前の一次サマリーこの段階で、AIにまず出させるとよいのは次のようなサマリーです。5段階評価の一次サマリー肯定計(非常に+やや当てはまる)で見ると、価格・コスパをよく検討する: 66.2%友人・家族との時間を大切にする: 52.7%定期的に運動時間を確保している: 33.0%流行やトレンドに敏感: 23.2%新しいテクノロジーをまず試す: 15.7%この時点で見えるのは、このサンプルは「新奇性」よりも「生活実感」「コスパ」「身近な人との時間」に寄っているという輪郭です。ただし、これはまだ全体傾向の把握に留め、解釈は次段階に回すのが安全です。継続的な活動の一次サマリー複数回答では、選択率上位は次です。ゲーム・アニメ鑑賞: 40.2%旅行・アウトドア: 32.2%音楽・芸術鑑賞: 31.3%スポーツ・運動: 28.8%読書・自己啓発: 26.7%ボランティア・コミュニティ参加: 6.8%ここで重要なのは、A社がスポーツクラブであるにもかかわらず、 継続活動としての「スポーツ・運動」が最多ではない という点です。これが後の分析の起点になります。価値観順位の一次サマリー1位回答だけを見ると、心身の健康: 249件自分らしさの表現: 134件経済的な安定: 112件家族や友人との絆: 93件新しい体験や刺激: 12件かなり明確で、 最上位価値としては「刺激」より「健康」と「安定」が強い という構図です。・データを確認したところ、600サンプル・30列で構成され、完了回答のみで構成されていました。・性別は男女各300、年代別は20代・30代・40代が各200で、若年〜中年層の比較に適した配分です。・設問は、属性5項目、5段階評価5項目、複数回答7項目、価値観順位3項目、自由記述1項目に整理できます。・複数回答の空欄は未選択として扱うべきであり、欠損ではありません。・一次集計では、「価格・コスパをよく検討する」が肯定計66.2%で最も高く、「心身の健康」が価値観1位で最多でした。一方、「新しいテクノロジーをまず試す」は15.7%に留まり、先進性より生活実感寄りのサンプル像がうかがえます。データチェックの結果を見ると、セルフ型アンケートツールQiQUMOから取得したローデータの構造は質問項目と回収数に整合しており、入力データに関しても異常値・欠損は検出されませんでした。セルフ型アンケートツールQiQUMOでは、モニター管理が徹底されていることに加え、システムによる重複登録チェックや不適切・不誠実回答の除外により、取得したローデータはそのまま集計に使える状態になっていることがほとんどです。このプロンプトでは調査結果のサマリーを出力させています。セルフ型アンケートツールQiQUMOでは、ダッシュボードで各設問項目の単純集計結果を見ることができますが、ダッシュボードに表示されている結果と上記のサマリーの結果を照合して、生成AIの集計が正しいかどうかをチェックします。2. 単純集計で調査結果の全体像を掴むローデータの確認とクリーニングが済んだら、次に単純集計によって調査結果の全体像を把握します。そのうえで、生成AIから結果の読み取り方のヒントを得ながら、次の分析工程へ進みます。調査結果のローデータをプロンプトに追加し、以下のプロンプトを入力します。【プロンプト】添付したファイルはアンケート調査のローデータです。 この段階では、データの解釈や分析には進まず、まずは単純集計だけを行って、調査結果の全体像を把握してください。 【目的】 このローデータについて、各設問の回答分布を確認し、調査結果の全体像を把握したいです。 ここでは、回答傾向の把握に必要な単純集計表を出すことに限定し、意味づけや要因分析、仮説立てには進まないでください。【やってほしいこと】1. 各設問について単純集計を行う2. 出力形式を統一する3. 全体像把握のために最後に一覧化する - どの設問で回答が偏っているか- どの設問で回答が分散しているか - 欠損が目立つ設問はあるか - 自由回答がどの程度入っているか を、あくまで集計表から読み取れる範囲で整理してください。 ※ここでは理由の解釈や分析はしないでください【必須ルール】 - 推測で断定しない - 不明な点は「不明」と書く - 単純集計表を出すことに限定する - 回答傾向の理由を解釈しない - 属性差の比較やクロス集計には進まない - 仮説立てや示唆出しはしない - 自由回答は件数確認までにとどめ、要約・分類・解釈はしない【出力(ChatGPT)】Q1-1. 毎週、定期的に運動やトレーニングをする時間を確保している回答形式:単一回答(5件法)有効回答数:600欠損数:0選択肢件数割合全く当てはまらない25242.0%やや当てはまる11318.8%非常に当てはまる8514.2%どちらとも言えない8213.7%やや当てはまらない6811.3%Q1-2. 新しいテクノロジー製品やアプリが出たら、まず自分で試してみる方だ回答形式:単一回答(5件法)有効回答数:600欠損数:0選択肢件数割合全く当てはまらない24841.3%どちらとも言えない14524.2%やや当てはまらない11318.8%やや当てはまる6811.3%非常に当てはまる264.3%(Q1-3.~Q4.省略)単純集計から見える全体像の整理回答分布の広がり・偏り偏りが比較的大きい設問「毎週、運動やトレーニング時間を確保している」 「全く当てはまらない」42.0%「新しいテクノロジー製品やアプリをまず試す」 「全く当てはまらない」41.3%「価格やコストパフォーマンスをよく検討してから購入する」 「やや当てはまる」38.2%、 「非常に当てはまる」28.0%順位回答の1位 「心身の健康」41.5%比較的分散している設問「流行やトレンドには敏感」 28.5% / 26.3% / 22.0% / 18.0% / 5.2% と複数選択肢に分布「友人や家族と過ごす時間を大切にしている」 最多でも35.0%で、他選択肢にも分散複数回答設問の広がり最多選択は「ゲーム・アニメ鑑賞」40.2%次いで「旅行・アウトドア」32.2%、「音楽・芸術鑑賞」31.3%最少は「その他」5.5%、「ボランティア活動・コミュニティ参加」6.8%欠損の有無欠損が見られなかった設問属性設問5件法の本問順位回答設問欠損が見られた設問「その他(具体記入)」:欠損567自由回答「普段のライフスタイルで大切にしていること」:欠損121※複数回答設問の各選択肢列の欠損は、値の入り方からみて未選択として扱うのが妥当です。回答量の多い/少ない設問回答量が多い自由回答「普段のライフスタイルで大切にしていること」有効回答479件(79.8%)回答量が少ない自由回答「その他(具体的にご記入ください)」有効回答33件(5.5%)実質無回答に近い自由回答「普段のライフスタイルで大切にしていること」 166件「その他(具体的にご記入ください)」 14件 生成AIで行った単純集計の結果は、専用のアンケートソフトを使って集計した結果と同じでした。複数の集計済みのローデータから単純集計をchatGPTとGeminiで実施してみましたが、すべて正しい結果が得られたため、数百行✕数十列程度のデータテーブルであれば、生成AIはアンケートの単純集計を正確に計算できるようです。ただし、数千行に及ぶデータ量がある場合、入力上限(コンテキストウィンドウ)を超えたり、読み飛ばしによる精度低下が起きる可能性があるため注意が必要です。単純集計は各設問の全体の傾向を見る上での最初のチェックポイントです。プロンプトで「回答の偏り」「回答の分散」のある設問を出力させることで、人間がダッシュボードのグラフを見て人間が感じる印象の裏付けになることに加え、見過ごしたデータの特徴を指摘するチェック機能を果たします。3. 単純集計から論点候補を出す全体の傾向を把握した次のステップとして、集計結果の解釈・分析に進むためにデータから何が見えてくるのか、調査目的を踏まえて論点を抽出します。生成AIに対して最初に提示した調査企画を前提として、調査目的に沿った論点を提案させるための要素をプロンプトに含めます。【プロンプト】この一次サマリーだけを根拠に、以下を出力してください。1. 注目すべき論点を3個2. 各論点について「データから言える事実」と「まだ仮説に留まる解釈」を分けて記述3. 若年層獲得のために優先して深掘りすべき論点を順位付きで示す4. 各論点を検証するために次に行うべきクロス集計案を示す5. 新規サービス開発またはマーケティング施策に転用できそうな示唆の方向性を述べる重要:- 推測を事実のように書かない- 因果関係を断定しない- この段階では「確定したインサイト」ではなく「深掘り候補」を出す- 出力は「論点整理メモ」として、見出し付きで簡潔にまとめる【出力(ChatGPT)】1. 優先論点の一覧論点1「健康」は最重要価値だが、実際の運動習慣は強くないデータから言える事実 価値観1位では「心身の健康」が最多。 一方で、「定期的に運動時間を確保している」の肯定計は33.0%、継続活動としての「スポーツ・運動」は28.8%に留まる。まだ仮説に留まる解釈 健康意識は高いが、運動実践には結びついていない層が相当数いる。 A社にとっては、「本格派向けの運動」より「無理なく続けられる健康習慣」の提案余地があるかもしれない。次に見るべきクロス 年代別 × 運動時間確保 年代別 × スポーツ・運動 心身の健康1位 × 運動時間確保施策の方向性 「運動好き向け」より、「健康は大事だと思うが習慣化できていない層」向けの導入商品設計が有望。論点2現役世代では“先進性”より“コスパ”が強いデータから言える事実 「価格・コスパをよく検討する」が66.2%で最も高い。 「新しいテクノロジーをまず試す」は15.7%でかなり低い。まだ仮説に留まる解釈 若年層獲得の打ち手として、最新性や先端機能よりも、「費用対効果」「通いやすさ」「時間効率」のほうが響く可能性が高い。次に見るべきクロス 年代別 × コスパ重視 性別 × コスパ重視 コスパ重視 × 運動時間確保 コスパ重視 × 継続活動施策の方向性 高機能・高付加価値の訴求だけでなく、「短時間」「無駄がない」「生活に組み込みやすい」という打ち出し方を検討すべき。論点3“フィットネス中心の生活者”より、“娯楽・余暇が競合する生活者”として捉える必要があるデータから言える事実 継続活動では「ゲーム・アニメ鑑賞」が40.2%で最多。 「旅行・アウトドア」「音楽・芸術鑑賞」も3割超で、「スポーツ・運動」はそれらより低い。まだ仮説に留まる解釈 A社が競っているのは他のスポーツクラブだけではなく、可処分時間の奪い合い全体である可能性がある。 若年層向け施策では、「運動をしよう」より「今の生活に無理なく差し込める」が重要かもしれない。次に見るべきクロス 年代別 × 継続活動 スポーツ・運動選択者 × 他活動併用 運動時間確保 × ゲーム・旅行・音楽活動施策の方向性 週何回も通う前提ではなく、短時間・低負荷・予約しやすい・ついで利用しやすいサービス設計の検討余地がある。2. 深掘り優先順位健康価値と運動実践のギャップコスパ重視の強さ余暇競合としての娯楽活動の存在刺激より安定を求める価値観この順がよい理由は、A社の課題が「若年層の新規獲得」であり、実際のサービス設計や訴求軸に直結しやすいからです。3. この段階ではまだ言えないこと若年層が特にどの傾向を持つかは、まだ単純集計だけでは不明どの価値観が入会意向に効くかは不明健康重視層が本当にA社の見込み客なのかは不明因果関係は確認できていない4. 次工程の分析課題年代別・男女別クロス集計で年代・男女特有の差を確認する自由記述回答の結果を分析する生成AIが出力した結果を見ると、「データから言える事実」→「仮説に留まる解釈」→「次に見るべきクロス」→「施策の方向性」というロジックで、データから何が言えそうかを分析しています。それぞれの集計結果をどう解釈すべきかを客観的データをもとに優先順位つきで提案してくれることは、データの解釈を言語化する上で有効な指針となり得ます。このアンケートの例では、フィットネスクラブの若年層獲得のためのライフスタイル分析という明確な目的に対して、調査結果からどんなことが言えそうか、それをもとにどんな施策が有効化といった段階まで踏み込んでおり、分析の方向性を検討する上でも参考にすることができます。4. クロス集計と自由回答のテキスト解析単純集計結果をもとにした論点整理では各論点ごとにクロス集計の候補が挙げられています。すべての候補を実行してみて、その結果から意味のあるクロス集計結果を特定するといったやり方も考えられますが、比較対象が多くなり混乱するため、論点整理で生成AIから提案された「4.次工程の分析課題」に挙げられた以下の2項目のみを実行してみます。【プロンプト】上記の論点整理の結果をもとに、「4.次工程の分析課題」を実行してください。【出力(ChatGPT)】以下、「4.次工程の分析課題」だけを実行します。 元データは添付CSV 600件を用い、年代別クロス、価値観×行動のクロス、自由記述の語の確認を行いました。Q1-1 運動時間確保区分非常に当てはまるやや当てはまるどちらとも言えないやや当てはまらない全く当てはまらない肯定計20代・男性1518197413320代・女性15221516323730代・男性13301513294330代・女性1315513542840代・男性2314166413740代・女性61412135520Q1-2 新しいテクノロジーをまず試す区分非常に当てはまるやや当てはまるどちらとも言えないやや当てはまらない全く当てはまらない肯定計20代・男性6162920292220代・女性6182614362430代・男性6103021331630代・女性3101319551340代・男性492718421340代・女性152021536(Q1-3.~Q3.省略)クロス集計から言えること1. 運動時間確保は「30代男性」と「40代女性」で差が大きい最も高いのは 30代・男性 43%最も低いのは 40代・女性 20%30代・女性 28% も低め2. 新テクノロジー試用は、年齢が上がるほど弱くなる20代女性 24%、20代男性 22%40代女性 6% が最低全体としてかなり低水準3. 家族・友人との時間重視は女性で高い30代女性 63%、20代女性 60%男性は相対的に低いが、40代男性は59%まで上がる4. コスパ重視は全カテゴリで高いが、特に高いのは30代女性と40代40代男性 74%、40代女性 72%、30代女性 71%最も低いのは 20代男性 52%5. Q2では「20代女性」と「男性各年代」で余暇の置き方がかなり違う20代女性は「旅行・アウトドア 45%」「音楽・芸術 36%」20代男性 53%、30代男性 55% は「ゲーム・アニメ鑑賞」が突出40代男性 41% はスポーツ・運動が最も高い6. 価値観1位は、20代男性だけかなり違う20代男性は「自分らしさの表現 39%」が最多それ以外の5カテゴリは「心身の健康」が1位Q4.自由記述生活上の優先事項・制約を示す語は以下のようになります。自由記述内で確認できた主要語479件の自由回答を対象に、代表語の出現件数を確認しました。語件数時間42無理33健康31ストレス27家族21睡眠13自分の時間9バランス5お金4仕事4確認できたこと「時間」「無理」「健康」「ストレス」「家族」が比較的多い費用関連語は少ないがゼロではない「通いやすさ」「近さ」「手軽さ」など、クラブ選びに直結する語は今回の設問ではほぼ出ていないQ4.実際に確認できた表現の方向自由記述では、次の方向の表現が複数見られました。時間確保例:「自分の時間」「家族との時間」「休める時間」負荷を上げすぎない生活例:「無理をしない」「無理なく自分のペース」健康維持例:「健康」「健康第一」「健康管理」ストレス回避例:「ストレスを溜めない」「ノーストレス」休息・睡眠例:「睡眠」「適度な睡眠」ここから言える範囲生活設計上、重視されている語としては健康・時間・無理しない・ストレスを溜めない・睡眠 が目立つクロス集計の結果も既にアンケート集計ソフトで行った結果と一致しており、生成AIを使ったローデータからのアンケート集計は実用に足るものと判断できます。5.論点の検証とインサイトの導出単純集計結果からの論点抽出、クロス集計と自由記述回答の分析から、集計結果の解釈と分析を行います。ここまで生成AIが出力した上記の内容をもとに論点の検証とそこから導き出されるインサイトの導出も生成AIにやらせてみます。【プロンプト】ここまで出力された単純集計結果による論点、クロス集計結果から言えること、自由記述回答の分析から、論点の検証とそこから導き出されるインサイトを考えてください。【出力(ChatGPT)】1.論点検証論点1:「健康」は最重要価値だが、実際の運動習慣は強くない検証結果概ね支持されます。 ただし、「健康を重視する人ほど運動している」とまでは言えません。根拠価値観1位では、20代男性以外の5区分で「心身の健康」が最多。全体でも、運動時間確保の肯定計は33.0%、継続活動としてのスポーツ・運動は28.8%。クロス集計でも、スポーツ・運動選択率は全体に高いとは言えません。以前の確認では、「心身の健康」1位層の運動時間確保肯定率も35.3%で、極端には高くありませんでした。修正が必要な点単純集計段階では、「健康重視なのに運動できていない」という仮説でした。 クロス後もその方向は維持できますが、より正確には、健康は広く支持される価値観しかしそれが運動の習慣化にまでは十分つながっていないという理解が適切です。論点2:現役世代では“先進性”より“コスパ”が強い検証結果支持されます。 ただし、「若年層ほどコスパ重視」とは言えません。根拠「新しいテクノロジーをまず試す」の肯定計各カテゴリ6~24%と低くなっています。一方、「価格・コスパをよく検討する」は52~74%と全区分で高い結果が得られました。修正が必要な点単純集計段階では、「若年層には先進性よりコスパが効く」という読みでした。 ただし、クロス後に言えるのは、先進性よりコスパが強いのはその通りただしそれは若年層特有ではなく、むしろ全年代で強い特に高いのは30代女性と40代ということです。論点3:“フィットネス中心の生活者”より“娯楽・余暇が競合する生活者”として捉える必要がある検証結果支持されます。 特に若年層でこの傾向が確認できます。根拠全体単純集計では、継続活動の最多がゲーム・アニメ鑑賞 40.2%。6区分でみると、20代男性:ゲーム・アニメ 53%30代男性:ゲーム・アニメ 55%20代女性:旅行・アウトドア 45%、音楽・芸術 36%スポーツ・運動は20代男性 29%20代女性 19% と、若年層では主軸活動ではありません。さらに、スポーツ選択者も他余暇活動を併用しており、 「運動する人」と「娯楽を楽しむ人」が分離しているわけではありませんでした。補足この論点は、単に「運動が嫌われている」ということではなく、 生活の中で運動が優先順位の上位に置かれていない、という理解の方が近いです。2. クロス集計で追加で見えたこと単純集計では見えなかったが、クロスで追加確認できた点です。1. 若年層といっても男女で置き方が違う20代男性価値観1位は「自分らしさの表現」39%で最多継続活動は「ゲーム・アニメ鑑賞」53%が突出20代女性価値観1位は「心身の健康」40%継続活動は「旅行・アウトドア」45%、「音楽・芸術」36%つまり、同じ20代でも競合する生活時間の中身が違うため、ひとつの訴求でまとめるのは無理があります。2. 運動習慣の弱さは特に女性側で目立つ運動時間確保の肯定計は30代女性 28%40代女性 20%スポーツ・運動選択率も20代女性 19%40代女性 22%よって、「運動を始める」「続ける」ハードルは、女性側でより高い可能性があります。 ただし、その理由が時間・価格・心理的抵抗のどれかは、このデータだけでは不明です。3. 20代男性だけ価値観の中心が違う他の5区分は1位が「心身の健康」ですが、20代男性だけは「自分らしさの表現」39%です。 この差は大きく、若年男性には「健康のため」だけでは刺さり切らない可能性があります。3. 自由記述を踏まえた補強自由記述で複数見られた方向は以下でした。時間確保 例:「自分の時間」「家族との時間」「休める時間」負荷を上げすぎない生活 例:「無理をしない」「無理なく自分のペース」健康維持 例:「健康」「健康第一」「健康管理」ストレス回避 例:「ストレスを溜めない」「ノーストレス」休息・睡眠 例:「睡眠」「適度な睡眠」ここから言えること自由記述はクラブ選びを直接聞いたものではありません。 したがって「入会障壁」と断定はできませんが、少なくとも生活条件としては、時間を圧迫したくない負荷を上げすぎたくないストレスを増やしたくない健康は大事にしたいという方向が見えます。4. 導き出されるインサイトここでは、データから比較的強く支えられるものだけを残します。インサイト1健康は「強い動機」だが、運動は「強い習慣」ではない多くの区分で「心身の健康」が最上位価値である一方、運動時間確保やスポーツ実施率は高くありません。 つまりA社が向き合うべき相手は、すでに運動が生活の中心にある層ではなく、健康意識はあるが、運動はまだ生活の主軸になっていない層です。インサイト2刺さるのは「先進性」より「納得感のある日常化」新テクノロジー試用意向は低く、コスパ重視は全区分で高いです。 ここでのコスパは、単なる安さだけでなく、時間対効果・手間対効果・生活への組み込みやすさまで含む判断基準として見た方がよいです。 A社が訴求すべきは、「最新設備」そのものより、やる意味があり、無駄がなく、続けやすいことです。インサイト3若年層攻略では「運動需要」ではなく「余暇競合」を見た方がよい20代男性はゲーム・アニメ、20代女性は旅行・アウトドアや音楽・芸術が相対的に強く、運動は優先順位の高い定番活動ではありません。 A社の競合は、他のスポーツクラブだけではなく、生活の中ですでに習慣化されている余暇活動全般です。 したがって、「運動を始めよう」より、今の生活を崩さずに足せる見せ方の方が適合しやすいです。インサイト4若年男性と若年女性は、同じ若年層としてまとめない方がよい20代男性は「自分らしさの表現」が価値観1位で、娯楽寄りの余暇構成です。20代女性は「心身の健康」が1位で、旅行・アウトドアや芸術鑑賞が強いです。 つまり、若年層向け施策を一括で考えると焦点がぼやけます。若年男性向けと若年女性向けは、入口メッセージを分ける前提で考えた方がよいです。単純集計で挙がった論点をクロス集計で検証し、さらに自由記述で補強するという流れを踏むことで、アンケート結果から導けるインサイトが整理されています。生成AIが導き出した当アンケート結果から得られるインサイトは以下の4点です。健康は「強い動機」だが、運動は「強い習慣」ではない刺さるのは「先進性」より「納得感のある日常化」若年層攻略では「運動需要」ではなく「余暇競合」を見た方がよい若年男性と若年女性は、同じ若年層としてまとめない方がよいこのアンケート調査は、生成AIを使わずに分析を行ったものを既にこちらで公開しています。生成AIが介在しない人の手で分析し結論づけたインサイトと比較をしてみます。健康意識は高いものの現役世代のライフスタイルという点では、経済面や社交面に関心が向かわざるを得ない現実が浮かび上がる。心身の健康を重要視する価値観はすべての層に共通しており、経済面での負担を考慮した料金プランの設定やコミュニティづくりの場として気軽に参加できるプログラムの開発などを通じて、働き盛り世代を取り込むための戦略を具体化していく。今回の生成AIを使ったローデータからの定量分析では、単純集計とクロス集計の結果からの論点抽出や仮説の設定といった部分を筋よく言語化することに大きな強みが感じられます。定量分析としては数値の大小にしか着目していませんが、設問と結びつけて比較対象が言語化されることが、結果の理解と解釈の助けになります。一方、ローデータから単純集計、インサイト導出までの一連の流れのなかで、調査全体の文脈に沿わない情報がプロンプトに混入すると、出力にもノイズが乗ってしまうこと、また、必要な項目の指定や重み付けといった要素については、プロンプトによる明示的な指示が不可欠であることも確認できました。これらを総合して、定量分析に生成AIを使う場合には以下の点が重要となります。データの保護とクレンジング段階的かつ明確な指示とファクトチェックインサイトを得るための文脈の共有集計結果と解釈を分ける仮説を事実のように書かせない設問で聞いていないことは“不明”とする最終的なインサイトは調査の目的と照合して人が絞り込む6.まとめ2年ほど前、生成AIにアンケートの集計データ(CSV)を入力し、解釈や分析を試みた際は、十分な精度が得られませんでした。しかし今回、すでに分析済みのアンケート調査の定量分析を生成AIで検証し、正確な集計ができたことで、生成AIの実用範囲が急速に高まっていることを確かめることができました。これまでアンケートの集計には専用ソフトを用いることが一般的でしたが、生成AIを使って集計・分析からインサイトの抽出までを行えることで、アンケート業務におけるハードルが一つ取り除かれたといえます。専門的なスキルや経験が求められたデータ処理と読み解きのプロセスのなかで、生成AIをガイドとして用いることによって、調査結果から有益な示唆を得るまでの作業は驚くほどスムーズになりました。ここに、アンケートの作成から配信、回収までを費用を抑えつつ迅速に完結できるセルフ型アンケートツールQiQUMOを掛け合わせることで、その効果はさらに最大化されます。日々の業務のなかで生まれた疑問や仮説に対し即座に調査を立ち上げ、集まったデータからAIのサポートを得て素早く次の一手を見出す。こうしたアジャイルな市場分析のサイクルを回すことは、もはや一部の専門家だけのものではなくなっています。生成AIとセルフ型アンケートツールQiQUMOを組み合わせることで、顧客のリアルな声はより身近なものとなり、あらゆるビジネス課題の解決を後押しする強力な武器となるはずです。