ビッグデータとは

2013年頃からバズワードとなった「ビッグデータ」。 数年の時を経て、企業ので活用に再び注目が集まっています。

ビッグデータの定義(3つのV)

アメリカの調査会社ガートナー社はビッグデータを以下のように定義しています。

  • データの量(volume) - データの量が大きいこと。

  • データの速さ(velocity) - 更新頻度が高いこと。

  • データの多様性(variety) - 異なる形式のデータが多いこと。

ビッグデータはデータの量、種類、出現頻度について、それぞれ十分な規模を満たしているデータと言えます。

ビッグデータの本質

前述の定義は少し分かりにくいかもしれません。 十分な規模のデータとは、現実世界を表すのに十分な情報が含まれたデータと解釈できます。

つまりビッグデータは現実世界を表すのにに十分な細かさと網羅性を持つデータと言い換えることができます。

この現実を表す細かさと網羅性を持つデータという考え方こそが、ビッグデータの本質です。

ビッグデータマーケティングとは

従来のマーケティングに用いるデータは「一部を抜き取った局所的なデータ」でした。 情報を適切にサンプリングし、その局所的なデータを検証することで母集団を推定します。

対してビッグデータは、前述の通り「現実を表す細かさと網羅性を持つデータ」です。

分析のイメージ

「一部を抜き取った局所的なデータ」と「現実を表す細かさと網羅性を持つデータ」では、規模だけでなく、性質が全く異なります。 上図のように、前者は分析データが母集団を推定するための判断材料であるのに対して、後者は母集団そのものを表しています。

ビッグデータマーケティングは今までとは異なる性質を持つデータを用いたマーケティングです。 ただの大規模データを用いたマーケティングと解釈するのは間違いです。

データの性質が異なれば、自ずとマーケティングのアプローチも異なります。 ビッグデータマーケティングでは現実を表すデータを活用したマーケティングを考える必要があります。

ビッグデータマーケティングで重要な2つのポイント

ビッグデータマーケティングを考える上で、以下の2つが最も重要なポイントになります。

  • データを集約すること

  • 相関関係に着目すること

詳しく説明していきます。

1. データを集約すること

あなたの会社が扱うデータは現在どのように管理されているでしょうか。 CRMであれば独自のデータベースに、Webの行動ログはGoogleAnalyticsに任せているでしょうか。 自社のサービスについてSNSで発信した人の投稿に関しても、別のデータベースで管理しているかもしれません。

このように管理が一元化されておらず、データ散在している場合、ビッグデータの恩恵を授かることは難しいでしょう。 バラバラに存在していては、その関係に有用な知見が隠れていたとしても、それに気づくことができないからです。

そこで「データを統一するための箱」であるDMPが重要になります。

DMP(データマネジメントプラットフォーム)とは

DMPとは、さまざまな種類の大量のデータを蓄積し、分析をおこなうことでマーケティングに役立てるシステムです。 その中でも、企業が自社のデータを含めて格納するものをプライベートDMPと呼びます。

自社のデータと、自社のマーケティングに有用なその他のデータを一元管理することで、 その総和である大量のデータを用いて、分析を行うことができます。 このプライベートDMPは広告をはじめ、多くのマーケティング施策を最適化するために用いられます。

顧客の情報、Webサイトのアクセスログ、問い合わせ履歴、SNSでの投稿のログなど、 さまざまな情報を一箇所に集めることで、網羅的なデータの集合、すなわちビッグデータとして用いることができます。

複数社がDMPを構築するためのサービスを提供しています。 最も有名なのはトレジャーデータ株式会社の提供するTREASURE DMPです。

利用するデータの分類

DMPに格納されるデータは、以下のように分類されます。

  • 1stパーティデータ

自社で独自に所持するデータです。 顧客情報や自社Webサイトの閲覧履歴などがこれに当たります。

  • 2ndパーティデータ

他社が独自に所持するデータです。 他社視点での1stパーティデータと言えます。

  • 3rdパーティデータ

自由に獲得し、利用できるデータです。 収集したSNSの情報や、外部から取得した情報、国が配信するオープンデータなどがこれに当たります。

マーケティングのゴールに対して、自社のデータを集約したものだけでは不十分かもしれません。 より大量の多種にわたる、高頻度のデータを集積するために、2nd、3rdパーティデータを利用するのが一般的です。

2. 相関関係に着目すること

因果関係と相関関係

因果関係と相関関係は異なります。

因果関係は、2つ以上のものの間に明確に「原因」と「結果」が成立する関係です。 例えば「電源をOFFにすると電気が消える」という関係の場合、 「電源をOFFにする」が原因で「電気が消える」が結果であると考えられます。 逆は成立しません。

相関関係は、一方が変化すると、他方も変化する傾向があるという、2つの値の関連です。 相関には「強い相関」や「弱い相関」が存在し、その強度も様々です。 例えばY=2Xという関数は、Yが変化すればXも変化する、逆も成立する強い相関です。

この二つの関係の違いを正しく認識することが、マーケティングでは重要になります。

従来の手法における相関関係

従来のマーケティングでは「因果関係」を理解することが必須でした。

分析のイメージ

因果関係を導くことは、上図の分析データから母集団を導く「推定」の工程にあたります。 これはつまり、分析データで導かれた関係が「母集団でも適用可能な関係」であることを証明する作業です。 一方が「原因」で一方が「結果」であるという関係を様々な角度から検討し、妥当性を示すことは、 相関関係を見つけることに比べて、非常に手間がかかります。

なぜ因果関係を示さなければならないのでしょうか。 強い相関ではなぜ、母集団の関係を示せないのでしょうか。 これは、強い相関では以下のような可能性があるためです。

  • ただの偶然

強い相関関係がありそうでも、サンプリングの都合でたまたまその結果が出た可能性があります。

  • 複数要因のうちの1つ

関係が、相関関係の一部しか捉えていない可能性があります。

  • 疑似相関

直接的には相関関係がないにも関わらず、あたかも因果関係があるかのように見える相関を擬似相関と呼びます。

擬似相関について、例えば分析データの起床時間と年収に強い相関があったとします。 すると、「早起きは年収が高い」という因果関係があるかのように思われます。

しかし、実際は年齢が高くなるにつれて、起床時間が早くなり、年収もあがっていました。 つまり年収と年齢、年齢と起床時間がそれぞれ相関関係にあったのです。

これは分析データに年齢のデータが欠落していたために導かれてしまう、擬似相関です。

以上より、分析データで導かれる強い相関は、母集団には適用できない可能性があるということがお分かりいただけたでしょうか。

ビッグデータにおける相関関係

ビッグデータマーケティングでは、従来のマーケティングに比べて相関関係が非常に有用です。

分析のイメージ

上図のように分析データは母集団そのものを表します。 したがって、「分析データで導かれる関係」は「母集団で適用される関係」と等しいのです。

これは、従来のように因果関係を示さずとも、母集団の関係を証明できるということになります。 分析データで導かれる相関関係は、母集団の相関関係として、マーケティング施策に生かすことができるのです。

分析データのすべての関係は、母集団にも適用される関係であるというところが、最も重要なポイントです。

ビッグデータマーケティングの活用事例

ダイドードリンコ(株)の事例

ダイドー

http://www.dydo.co.jp/

飲料メーカーであるダイドードリンコ(株)は、自販機での販売にビッグデータを利用しています。

当社は自動販売機にて飲料を販売する際、消費者アンケート等の自社で抱えているデータのみで、 飲料業界では常識とされていた商品サンプルの配列を用いて商品サンプルの配置を決定していました。

常識とされていた商品サンプルの配列方法は、左上に人気商品を陳列するという方法でした。 これは、左上からZ字型に人間の視線が動くという性質を利用したものです。

その後、ビッグデータとしてより大規模、高頻度、多様なデータを収集するために、「アイトラッキング」の活用を開始しました。 アイトラッキングは、自販機の前に来た人が実際の自動販売機にて商品を購入する際にどこを見て、商品を認識しているのかを取得するものです。

これまでのデータに加えて、アイトラッキングで取得したデータを加えることで、消費者行動に関するデータがより詳細になり、 分析の効果が上昇しました。 その結果、これまで常識とされていた商品サンプルの配列方法は必ずしも有用ではないとの結果が得られました。 なんと左上よりも、左下に商品を陳列した方が売り上げが良かったのです。

これは、消費者アンケート等のデータとアイトラッキングで取得したデータを組み合わせることによって、 これまでにない知見と効果が得られたものと考えられます。

この年のダイドードリンコの売り上げは前年比の1.2%増と好調でした。

活用事例から見るポイント

自販機の例では、自社のデータに新たにアイトラッキングの視線データを導入しています。 データの種類が増えることで、新たな関係がわかるようになりました。 これは、1つ目のポイントであるデータの集約に当たります。

そして、データから、左下の商品と売り上げが大きさに相関関係を得ることができました。 これは、2つ目のポイントである相関関係への着目に当たります。

なぜ左下に配置すると売り上げが伸びるのか、その原因については分かっていません。 むしろ定説では、左上が最も売り上げが良かったはずです。

集約したデータが十分に現実世界を表し、因果関係ではなくその相関関係に着目することで、 売り上げの増加という成果が出た、ビッグマーケティングの良い事例です。

結論

ビッグデータ普及の懸念点

現状、ビッグデータを正しく集約するためには、まだまだ問題点があります。 その中の一つは、プライバシーの問題です。

プライバシーに関わるようなデータはそれが本人であるとわからない形で利用しなければなりません。 しかし、現実を表すほどの大規模データですから、SNSの情報との照合などによって、 逆にその人の個人情報が取得できてしまう可能性があるのです。

関係がわかってしまうということが、プライバシーを保証することを難しくしているという側面があります。

既存のマーケティングとの相互利用

既存のマーケティング手法がすぐになくなることはまずないでしょう。 現時点でビッグデータをマーケティングに利用することは「もう一つの視点」を持つと考えるべきです。

ビッグデータマーケティングで全ての有用な関係性を露わにすることは難しいでしょう。 しかし、人が気づくことのできなかった、さまざまな洞察を得ることができる可能性があります。

また、相関関係が因果関係を探る道標になることも大いにありえます。

中長期的な視点では「ビッグデータ」を利用することが当たり前になると考えられます。 それらを正しく活用することが、これから競合優位性を保つ上で必須になってくるでしょう。

まとめ

  • 現実世界を表すのにに十分な細かさと網羅性を持つデータがビッグデータである。

  • ビッグデータマーケティングは今までとは異なる性質を持つデータを用いたマーケティングである。

  • データの集約がビッグデータを活用する上で重要である。

  • ビッグデータマーケティングでは相関関係が重要である。

いかがでしたでしょうか。 ビッグデータマーケティングへの理解を深めていただけたならば幸いです。