第11回 「重回帰分析」ご使用上の注意(後編)


パース・イメージ 重回帰分析 ご使用上の注意

前回は重回帰分析(前編)として、どのくらいのデータ量や時間が必要になるのか、また広告における分析の難しさや、長期で取り組む際に向き合わざるを得ないジレンマについてお話ししました。今回の内容は、実際の運用上のポイントです。では、始めましょう。

広告投下に頼らなくても売上が見込めるケース

広告は「売れると予想される時期には厚くし、売れないと予想される時期には控える」という話を前回しましたが、広告投下に頼らなくても売上が見込めるケースもあります。わかりやすいのは、映画です。


グラフ 興行収入=日本映画製作者連盟 TVCM出稿量=ビデオリサーチ
(出典:興行収入=日本映画製作者連盟 TVCM出稿量=ビデオリサーチ)

上図は、2022年の興行収入ランキング上位の映画がどのくらいテレビCM出稿していたかを散布図にしたものです。例えば『名探偵コナン』や『すずめの戸締まり』は、他の映画作品よりも上に外れたところに位置しています。同じくらいのテレビCM出稿量の他作品と比べ、明らかに興行収入が高かった。逆の見方をすれば、それほど広告投下しなくてもしっかり集客できるだろうという見通しが元々立っていたとも言えます。

車のカテゴリーでは、毎年3月はディーラーの決算期で値引きが大きいことが知られており、3月は広告に頼らずに集客できるため、広告はそれより少し早めの1~2月に多く投下されます。広告投下に頼らなくても売上が見込めるケースがあることを意識することが重要で、重回帰分析を行う上ではそうした特殊なデータを入れてしまって分析が不安定にならないよう事前によく検討し、データを洗っておく必要があります。

説明変数同士が連動してしまうケース

マーケティングで重回帰分析を用いる場合、分析対象となることが多いのはデジタルまわりです。動画・ディスプレイ・SNS・記事タイアップ・検索連動型・成果報酬型など多岐にわたる広告種別のうち、何が有効なのか。こうしたデジタルまわりで特に気にしなければならないのが、マルチコの問題です。

マルチコはmulticollinearity(多重共線性)の略で、説明変数の間で相関の高い組合せが存在することにより分析結果の精度が悪化する状況を指します。例えば検索連動型の場合は広告がクリックされたタイミングで料金が発生する仕組みですが、クリックが増えているというのは興味を持つ人が増えている状況が背景にあると考えられますので、動画など他の施策の影響を受けている可能性を検討する必要があります。

マルチコは、説明変数と説明変数の間に因果関係がなかったとしても相関関係さえ強ければ起こってしまうものです。前回お話ししたように、広告はそもそも複数の施策を同じ時期に集中的に投下する傾向があります。広告の重回帰分析ではマルチコをかなり注意深く見ていく必要があり、それが発生しているケースでは、該当する説明変数を取捨選択するなどの対応を行うことになります。

A・Bに相関があるときの因果関係は4パターン

Aという事象とBという事象に相関関係が見られる場合に「AがBの原因である」とつい早合点してしまうことがありますが、これは重回帰分析に限らず数字の見方全般において、気をつけなくてはならないポイントです。

A・Bに相関があるときの因果関係は、主に下記の4パターンがあります。
① AがBの原因(A→B)
② BがAの原因(B→A)
③ CがAとB両方の原因(C→AB)
④ AとBには因果関係がない(A×B)

この中で、特に重要なのが③のC→ABです。この関係を交絡(こうらく)と言い、原因Cを交絡因子(こうらくいんし)と呼びます。


写真 傘

例えば「昨日より2~3度気温が低い」「傘が売れる」という2つの事象に相関があったとします。このときに、両方の原因となる交絡因子の「雨が降っている」という事象に気がつくことができないと、「今日は昨日より肌寒いから店先に傘を並べよう」といって雨も降っていないのに傘をたくさん並べてしまうかもしれません。もちろん雨が降っていなければ、寒くても寒くなくても、傘はそんなに売れません。

また、楽天市場とAmazonのユーザーの意識を比較したところ楽天市場のユーザーの方が「食や健康」に関する意識が強かったとします。この場合も楽天市場のユーザーであることと「食や健康」に関する意識が強いことに何かしら共通の原因がないか、立ち止まって考えてみる必要があります。もしかすると、ポイントを集めたい主婦・主夫が楽天市場をよく使っており、主婦・主夫は家事分担として食事を作ることが多いため「食や健康」への意識が強い、という可能性もあるかもしれません。疑わしい交絡因子がありそうな場合は、主婦・主夫とそれ以外で改めてクロス集計を行うなどの確認が必要です。

受講生からの質問:
相関が高い2つの事象の共通の原因である交絡因子の存在に気づくかどうかが重要とのことだったのですが、何か考えるときのコツってありますか? あと、④のA×Bというのがあまりうまくイメージできません。因果関係がないのに数字だけ相関するっていうこと、あるんでしょうか?

交絡因子を考えるときは、年齢や家庭内役割などデモグラですぐに切れるようなシンプルな条件を当ててみて、考えるのがいいと思います。

会社勤めの人の中で「血圧が高い」「年収が高い」という2つに相関があったとき、①のようにA(=血圧が高いこと)がB(=年収が高いこと)の原因だと考えてしまうと、夜中にラーメンを毎日食べて血圧が高くなればいいのかと思ってしまいますが、それで年収が高くなる気はあまりしません。


写真 ラーメン

この場合、「年齢」が交絡因子になっていないかと考えれば、年齢が高い人が血圧が高く、年収も高いという傾向はたしかにありそうです。このように、交絡は当てて考えてみれば自然に腑に落ちることが多いので、①A→B以外の因果関係のパターンもあるのを意識したうえで考えを巡らせてみるといいと思います。

AとBに相関はあるけれども因果関係がないというパターンで有名なのは、ハリウッド俳優のニコラス・ケイジの映画出演本数とプールの溺死者の数です。ご興味のある方は「ニコラス・ケイジ」と「プール」で検索してみてください。

今回は、重回帰分析を実際に運用していくうえでのポイントについて、お話ししました。次回のテーマは「ターゲット設定」です。

(次回は7月31日公開予定です)

advertimes_endmark


北村 陽一郎(電通 ソリューション・デザイン局/統合プランニング・ディレクター)
北村 陽一郎(電通 ソリューション・デザイン局/統合プランニング・ディレクター)

1973年生まれ。東京大学教育学部卒、1996年電通入社。テレビ広告・スポーツ放送権業務などを経て、2012年より広告プランナー。自動車・食品・精密機器・金融・アプリなど幅広い広告主のプランニングに従事するかたわら、社内向けの少人数制プランニング塾「北村塾」を開講中。NPS=98.4、推奨度平均9.89点という圧倒的な人気を得る。

北村 陽一郎(電通 ソリューション・デザイン局/統合プランニング・ディレクター)

1973年生まれ。東京大学教育学部卒、1996年電通入社。テレビ広告・スポーツ放送権業務などを経て、2012年より広告プランナー。自動車・食品・精密機器・金融・アプリなど幅広い広告主のプランニングに従事するかたわら、社内向けの少人数制プランニング塾「北村塾」を開講中。NPS=98.4、推奨度平均9.89点という圧倒的な人気を得る。

この記事の感想を
教えて下さい。
この記事の感想を教えて下さい。

このコラムを読んだ方におススメのコラム

    タイアップ