読者です 読者をやめる 読者になる 読者になる

dataminer.me

データマイニングやその周辺のお話を書くブログ

Big data is like teenage sex(ビッグデータは10代のセックスのようなもの)

Big data is like teenage sex

検索で引っかかったどこぞやの大学の人の言葉を引用してみました。

 

 

ざっくりとした訳は「みんながそれについて話し合うけど、実際それをどうやるか知らない。自分以外のみんながそれをやっていると思っているから、みんながやっているといっている。」って感じ。

 

最近思うこと

「ビッグデータ」はアドテクの業界でも「データマネジメントプラットフォーム」とかDSP/RTBとかに関連して話題になっているし、よくお客さんからも相談をされる。会社の新規事業として「ビッグデータ」を扱いたい場合もあるし、「ビッグデータ」のチームを作ったけど、全然機能していないからどうにかしてほしいという話とかもあったりします。引用している記事の通り、みんなビッグデータを生かす組織を作りたいとか、うまくいってないのでどうしたらいいかみたいな問題をかかえていたりします。

そんな相談をされるときにお話をさせていただく、ビジネスにビッグデータを生かすために本当はすごく大切だけどあまり検討をされていないビッグデータを生かすときに個人的に気をつけている点を3点ほど。

 

1.アクションプランへのつなぎ込み

「分析をした結果、うちの顧客には○○というペルソナと××というペルソナがいることがわかりました!」という話をされることはあるけど、「その人にアプローチするためにはどうすればいいの?」とか「何のシステムとどう連携するとその結果は施策になるの?」とか、そういうアクションプランと連携できているケースは少ない。

出てきた結果をどういう風にアクションプランにつなげるかの部分がないとお金儲けをするのがかなり難しくなると思う。アクションプランまでのつなぎ込みができていない場合、ビッグデータチームはそれっぽいことを言うだけでお金をもうけることができない評論家の群れみたいなチームになっちゃうことが多い気がする。

 

2.他社データとの連携

実はビッグデータをビジネスに利用する際に自社データに加えて他社データ(例えば、Web閲覧履歴や購買履歴)もあわせて使うことが重要。自社データの中には「興味を持ったけど顧客にならなかった人」と「顧客になった人」の2つの顧客パターンしか包含していないので新規顧客の獲得に生かしづらい。他社のデータの中にはもちろん上記の2つの顧客パターンに加えて「新規顧客」が含まれる。

自社データと他社データをしっかり掛け合わせて既存顧客から適切なペルソナを見つけ出しターゲティングをしていかないとCRMや広告のリターゲティングのような既存の顧客の再来訪を促進するようなアクションプランにしかデータを生かせないことが多い。

 

3.リアルタイム性

これはどちらかというとテクニカルな部分で検討されていないことが多い。ビッグデータを使った何かをやる時、莫大な時間をかけて解析をしてその結果を使うことが多い。解析結果の確からしさを評価する場合、過去のデータを元に解析した結果を使って単一のモデルを作り評価を行うことが多い。しかもその評価があろうことか「2K(勘・経験)」でされることが多い。そうすると、「今まさに起こっていることを解析すること」よりも「過去に起こった至極当たり前な事象をアウトプットで出すこと」の方にインセンティブが生まれてしまう。でも、例えばランキングだと「最新のランキング」と「累積のランキング」を比較すると前者の方が引きが強いことが多い。

「大量のデータを長時間かけて整地な解析して結果を出すこと」が最適な手段ではなく、「再現性を担保するために必要十分なデータをなるべく素早く解析してアクションに反映すること」がビッグデータを生かす際に重要なことだと思う。

 

総括

ビッグデータ自体の熱が高まっていることはデータサイエンティスト(笑)な人としてはうれしいことだけど、今まで話を聞いた会社だと「環境整備に金がかかる割に役に立たない」とか、「環境は整ったけどどうすればいいかわからない」とか、聞いていて少し悲しくなるようなことを言われることが多い。少しでもそういった方にこのエントリーが役立つといいな。