先日、とある勉強会で数値解析をエクセルで行う方法を教えてもらう機会がありました。多変量解析やらなにやら数値解析にもたくさんありまして、私は専門家でもないので下手なことは言わないでおきますが、その中の相関分析がリスティング広告の分析で生かせそうだと思ったので少しご紹介できればと思います。
少し長文ですが、知っていて損はない分析の基礎ですし、かなりに簡単で応用も効くと思いますので是非試していただければと思います。
なぜ試そうと思ったか?
通常こういった分析をする際は、とにかく事象をデータ化して整理するということが本当に手間で、そこがネックで進まないということがほとんどかと思います。
しかしながら、リスティング広告は運用データは勝手に蓄積されるので、いちいち収集する必要がありません。つまり、配信期間がそれなりにあれば、いきなり分析できるということですね。こんな利点を生かさない手はありませんね!
まず下準備
エクセルにはこういったデータ分析用のアドインが実は元から存在していますが、そのアドインは初期状態では非表示になっているのでそれをオンにする必要があります。下記の手順に従ってアドインを表示させてください。(Excel2010での説明になります)
①エクセルを開き左上の「ファイル」を押し「オプション」をクリック
②表示されたExcelのオプションで、「アドイン」を選択し「分析ツール」を選び、その下の「設定」をクリック
③アドインというウィンドウが表示されるので、「分析ツール」にチェックを入れてOKをクリック
④「データ」タブのとき一番右に「分析ツール」が表示されていれば、下準備完了です。
それでは本番
早速例題と共に進めていきましょう。
【例題】
とあるアカウントのキャンペーンの2年間の月別データを元に、コンバージョンと相関関係の深い数字を相関分析で探ってみる。(こういった分析って多いですよね?)
まずはデータを管理画面から取得します。
月ごとに分割したデータが必要なので、各々下記のようにデータをダウンロードします。データはとりあえず多いに越したことはないので、考えられうる表示項目は基本的にすべて表示させるようにしましょう。
Yahoo!プロモーション広告なら
レポート生成時の表示切替を「月」にして、該当期間(今回であれば直近2年)を選択し、レポート生成します。表示項目は基本的に全て表示されるようにチェックしましょう。
Google AdWordsなら
レポートツールに進んでいただき下記のように一番左の列を「月」のみにして、あとは全ての数値データがその右に入力されるように設定しましょう。
レポートデータ(CSV)を加工
レポートを少し加工をしましょう。まずは、今回対象にするキャンペーン以外のデータは削除します。加えて、すべてが0の列や数字以外が入力されていると、このあとエラーが出たり、見辛くなりますのでそういったものを無くします。
合わせて、データの見やすさのためにデータの中で目的の数値を一番右の列を持っていきましょう。今回で言えば、コンバージョン(すべてのコンバージョン)になりますね。
それでは相関データ作成
データの加工が完了したら、エクセルの「データ」をクリックし、先程表示させた「データ分析」をクリックします。
データ分析というウィンドウが開くので、「相関」を選択してOKを押します。
そうすると、データの範囲を指定するウィンドウになりますので、月の列以外のデータを見出しごと全て選択し、下記のキャプチャのように設定します。(出力オプションの入力欄は任意のタイトルを付けていただければOKです)
OKを押すと、下記のような結果がエクセルの新規シートに出力されます。
生成されたデータの分析
生成されたデータの見方についてですが、縦横に同じ項目が並んでいて対戦表のように読んで数値同士の関連性を見ます。例題ではコンバージョンとの関連性を見たいので、一番下の行を見ていただければ分かりやすいです。
数値に関してですが、-1から1までの数値が入っているかと思います。正の数値であれば片方が増えればもう片方も増えるという関係、負の数値であれば片方が増えれば片方が減るという関係になり、数値の強弱は一般的に下記のように見ます。
- 0.3未満 ほぼ無相関
- 0.3-0.5 弱い相関
- 0.5-0.7 相関がある
- 0.7-0.9 強い相関
- 0.9以上 非常に強い相関
※上記数値は絶対値としてみていただき、負の数値に関しても同様です
それでは、今回の例題の数値を見てみましょう。
こちらを見ると、今回この中で強い相関を持っている数値はN、O、P列でこちらは各々「検索広告のインプレッションシェア」、「検索広告の完全一致のインプレッションシェア」、「検索広告のインプレッション損失率(広告ランク)」となっています。
P列のみ負の数値ですので、インプレッション損失率(広告ランク)は下げれば下げるほどコンバージョンが増えるという事になります。つまりN、O列は数値を増やせば、コンバージョンも増えるということになりますね。
こういった形で、どの数値を動かせば目標を達成することができるのか、という数値を分析することができます。
応用として、リスティング広告のデータだけでなく、リスティング広告のデータにアナログのデータをかけ合わせると管理画面だけでは見えない相関関係なども見えてくるかもしれません。例えばコンバージョンが問い合わせで、成約数はアナログでしか測れない場合などは、成約数をアナログで集計して列に加えると新たな切り口が見えるかもしれません。
注意点
データの項目としてはとりあえず多いほうが良いと思いますが、集計期間には注意が必要です。リスティング広告上で明らかに違う施策を行っている場合などはデータの比較自体に意味がなくなるので、あくまで近い施策をやっている期間内のみで分析をする必要があります。
まとめ
経験はこういった事柄を頭で瞬時に計算していくことだと思いますが、逆に経験による思い込みで間違ってしまうこともあります。こういった分析には思い込みの要素は一切なく、ドライに数値のみで分析が可能なので、経験だけで行き詰まったときにこういった分析をしてみるのも一手かと思います。
ただ分析には時間がかかるので、経験とハイブリッドに使い分けられるプレイヤーになれるとベストですね。