『なぜ教科書通りのマーケティングはうまくいかないのか 電通戦略プランナーが教える現場のプランニング論』2024年3月5日発売、好評発売中
前回はブランドエクイティについてお話ししました。今回のテーマは「重回帰分析」です。重回帰分析という言葉自体はかなり知られており、大きな期待値をかけられることが多い分析手法なのですが、実務上は数値がうまく出ないこともあります。なぜ、そうなるのか。プランニングで重回帰分析を採用するかどうか判断する際に知っておいた方がいいことについてお話しします。では、始めましょう。
期待値の大きい手法「重回帰分析」
重回帰分析は、2つ以上の変数を持つデータの中の関連性を分析する多変量解析の一つです。広告においては、「売上」などの成果(目的変数と言います)に対し、それに影響を与えると考えられる「広告A」「広告B」「広告C」などの要素(説明変数と言います)がそれぞれどのくらい貢献したのかを推計するという分析になります。
テレビやデジタルなど様々な広告手法がある中で、何がどれだけ売上に貢献したのかを分析したいという話はどの広告主においても聞かれます。そうした需要が高まっている中で、まさにそれを推計する重回帰分析は願ったり叶ったりというわけで、ご相談をいただくこともたいへん多くなっています。
例えば夜にテレビCMを見て、翌日にスマホでWeb記事を見てから店頭で化粧水を購入した場合、テレビCMとWeb記事のどちらが売上に貢献したかを測るにはどうするか。広告を見たテレビやスマホの機器が紐づいているか。スマホで記事を見た人と購入した人が紐づいているか。さらに機器で見るわけではない駅のOOHの貢献はどう考えるか。POSで取れない商品カテゴリーはどうするか。
モノを買う側から考えるとそういった難しさが出てくるのですが、広告主がその週、どの広告種別に何円の費用をかけたかという側から考えるのが重回帰分析で、この手法には上記の難しさをすべて突破してしまう爽快さがあります。ただ、実際にはどのくらいのデータ量や時間が必要になるのか、また広告における特有の難しさについて、関係者の中でほとんど認識されないままに期待値だけが高い状態でスタートすることも珍しくありません。
どのくらいのデータ量や時間が必要になるのか
2×a+3=7というように未知数が1つの方程式は、1本の式があれば解が求められます。未知数が2つになると2本の式が必要になります。これらは未知数がa=2のように特定できる場合なのですが、重回帰分析で取り扱う対象は実際にはどこまでいってもズレがあり、そのズレを許容できる範囲まで小さくしていくためにはたくさんのデータが必要になります。目安として、必要になるデータの本数は説明変数の個数の10倍と言われています。
つまり「テレビCM」と「OOH」という説明変数2個の売上に与える影響を見たい場合は、20個分のデータが必要になるというわけです(通常は週単位で集計しますので、20週分となります)。実際に分析を行う場合は「Web広告」や「ダイレクトメール」など説明変数がもっと多くなりますので、説明変数5個であれば50週で約1年分、説明変数10個であれば100週で約2年分のデータが揃って、ようやく信頼度が出てくるということになります。
広告における特有の難しさとは
説明変数の10倍のデータ本数が必要ということに加えて、広告における特有の難しさがあります。それは、広告はランダムに打っているわけではないということです。例えば「野球場のビールの売上」を目的変数に、「気温」「湿度」「ホームチームの勝敗」を説明変数にとった場合、それらはランダムにさまざまな値が出るので分析は比較的しやすいです。
しかし広告は当然ながら、売れると予想される時期には厚くし、売れないと予想される時期には控えるということをします。夏場にチョコレートの広告はほとんど出ません。外に持ち歩くと溶けてしまうので売れないからです。「広告がなく売上も低い週」と「広告がたくさん出て売上も高い週」の2つに偏るとどうなるかというと、「広告があると売上が高くなる」という分析結果が出やすくなります。広告会社にとっては都合がいい結果ですが、「そもそも売れる」という時期そのものへの評価が難しいという課題は残ります。
もう一つは、説明変数である「テレビCM」「OOH」「Web広告」など、複数の広告施策を同じ時期に集中的に投下する傾向があるということです。「気温」も「湿度」も高く「ホームチーム」も勝っているというデータばかりが集まっても、そのうちのどれが「ビールの売上」に貢献したのかはわかりません。「気温」は高いけれど「湿度」が低い日はどうだったか、逆はどうかなど、データがばらついてこそ個々の貢献度が評価しやすくなるのであって、かたまりのデータばかりでは要素ごとの重みづけが難しくなります。
クライアントにそうした説明をすると「数字がうまく出ないことの言い訳をしている」というような目で見られるのですが、実際にそうなので仕方ありません。売れる時期に複数の施策をまとめて打つ傾向のある広告はデータが偏りやすいため、そもそも重回帰分析はしづらいというのはあまり認識されていませんが、原則的なことであるように思います。
長い期間を与えられれば有効な分析ができるのか
受講生からの質問:
重回帰分析にはデータの本数がかなり必要で、広告特有の難しさもあるということなのですが、例えば3年など充分に長い期間を与えられれば、安定した有効な分析ができると考えていいのでしょうか?
基本的にデータの本数は多い方が安定しますので、50週よりは100週、150週あった方が信頼度としては増していきます。ただ、長期の分析で考えなければならないのはその間に前提となるビジネス環境が大きく変化する可能性があるということです。
例えば家庭用のレギュラーコーヒーは、数年の間に市場が大きく伸びました。セブンカフェのヒットで淹れたてのコーヒーのおいしさが再発見されたことや、コロナで在宅時間が増えたこと、家庭用コーヒーメーカーのラインナップが充実して普及率が上がったことなどが理由として指摘されています。広告の効果もあるかもしれませんが、こうした外部要因による影響は見逃せません。
また、数年経てばメディアの持つ力も変わります。テレビのリアルタイム視聴者数は減少し、TikTokのMAU(月間アクティブユーザー数)は上昇します。それぞれの説明変数への投下金額が同じでも、数年前と現在では到達人数が違ってきます。
データの本数は必要ですが、長期で見るときには外部要因や施策の効果の面で補正をかける検討もしなければならない。広告における重回帰分析はそのようなところにジレンマを抱えており、数学的な知見だけではなく俯瞰的な視野を必要とする、難易度の高い分析手法であるということを今回はお話ししました。
次回は、重回帰分析を実際に運用していく上でのポイントについてお話しします。
(次回は7月27日公開予定です)