dataminer.me

データマイニングやその周辺のお話を書くブログ

愛され系データマイニング屋に必要な5個のソフトスキル

前回のエントリーではどちらかというと技術的な区分で今回のエントリーではデータマイナーとして持っていると愛される(=仕事を湯水の如くふられる)ために必要なソフトスキルについての経験的なメモ。

 

せっかくデータマイナーをやるなら、マネーボールのピーター・ブランド(サーバーメトリックスの人)見たいに愛されながら働きたいですよね、ということでそのために必要だと思ったこと:

 

1.数字をいくらでも見ていられるスキル

膨大なKPIの中からみるべき数字を見つけ出すとか、毎日決まった数字を何個も見続けられるスキル。毎日みているKPIから仮説を構築したり、考察を加えると重宝されます。毎日KPIをみると素早く異変に気づくことができるし、それがあまり得意ではない人も多いので、これをやってあげるとみんなに愛される(見るべきKPIが無限増殖する)人生がスタートします。

 

2.みんな気づかない数値の関係性が見つけられるスキル

「おむつとビール」みたいな感じに○○と目標のKPIに関係があるみたいな、みんなが気づいていない関係を見つけられるスキル。野球のサイバーメトリックスも「勝利数と一番関係のあるパラメータは○○です」見たいな感じでこれに近いことかと。○○をあげるアクションまで提示できるとさらにいい感じ。毎日見ているKPIの中から関係のある数値を見つけるもよし、統計的に見つけるもよし。ただ、直感的に分かりづらい手法(SVMとか、主成分分析とか)を使うよりも直感的に分かりやすい手法(決定木とか、相関分析とか)を使ってあげると愛されやすい。愛には直感的なことも重要です。

 

3.定性的な目標を定量的に翻訳するスキル

目標が「来年までに世界で一番使われる機械学習のアルゴリズムを作る!」みたいな目標があったときに「よっしゃ!やったる!」ではなくて、具体的な数値目標に落とし込むスキル。例えば、「世界で一番使われている機械学習のアルゴリズムはGoogle Scholarで検索するとXXでそれの非引用回数はパブリッシュされてから月間○○件伸びているのでこれを超える!」みたいな数値目標があった方がPDCAまわしやすいですよね。というか、目標が定量化されていないとデータマイナーは仕事がなくなってしまうので、自分の必然性を訴えるためにも必須。愛されるための努力も愛され系には必要です。

 

4.数字の上下を一喜一憂できるスキル

組織にとって意味があるKPIがあがったら素直に喜んで、下がったら悲しめるスキル。数値を見ている人にとって数値の上下が結果のすべてだったりするので、対象のKPIが持つ事業上の意味を理解しつつちゃんと喜べるとか悔しがるとかデータマイナーとしてするべきだと思っています。逆に意味のない数字の上下には冷静に対処するというのも必要だと思っています。数字を毎日見ている分、その数字の変化に素早く気づくことができるし、ちょっとした変化に対しても周りより一喜一憂できるはず。愛嬌がないよりはある方がいいですよね。

 

5.数字を元にモチベートできるスキル

「この企画によって昨日比で○○%増加しました!」とかを使ってみんなのモチベーションコントロールしてあげられるスキル。グリーで見ていたチームでは割とここを意識してもらっていました。数字に強い人が結果を賞賛することで組織としてもテンションがあがるし、チームメンバーの数値に対するセンシティビティがあがるし一挙両得。データを見てにやにやしてるだけじゃなくて、笑顔をみんなに振りまくことも愛される秘訣。

データマイニングを仕事にする人の生態系

データマイニングを仕事とする人=データマイナー」はどういう人たちがいるかということについて

 

ビックデータとかで世の中がバズってるけど「僕はデータマイニングをやってます!」といったときに適切にその人がやっている業務領域を把握している人ってかなり少ないと思う。

 

グリーで働いていたときもデータマイナーはどういった仕事をしていて、何をやっていて何ができるのかっていうことを理解していなくてミスコミュニケーションが生まれていたと思うのでちょっとその生態系についてまとめてみた。おそらく、データマイナーといわれる人は以下のタイプがいる:

 

研究開発をする人

統計学的に新しいイノベーションを起こせる人。GooglePageRankアルゴリズムを作りましたとか、NetfrixやAmazonのレコメンデーションエンジン作りましたとかいう人がこれにあたる。スキル的には統計学にかなり長けている必要があり、その他にもいわゆる計算機科学にも詳しい必要がある。

 

ログコレクションを行っている人

Apacheのログとかを回収して、適切な部分だけ切り出してきてDBとかに格納してKPIツールや集計結果を利用する人にデータを提供する人たち。かなり職人気質でガチガチのエンジニア。スキル的にはHadoopとか、Fluentdとか、KVS/RDBなどに関するスキルを有していることが多い。

 

機械学習/統計学を使う人(エンジニア)

主に機械学習のアルゴリズムや最適化手法をサービスやコンテンツに実装する人たち。ログコレクションをする人と同様に予備実験のためにアドホックにHadoopを使ったりもする。スキル的には機械学習統計学の知識とともに、Webフレームワークやサーバーサイドの知識も有していることが多い。MahoutとかRとか使えると尚可。

 

機械学習/統計学を使う人(文系職)

機械学習/統計学を使う人(エンジニア)からWeb関連の知識を抜いた感じの人たち。機械学習統計学の専門家でWebやDBの知識を有していることなんてほとんどないので機械学習に関する知識を持っている人を雇う場合ほぼこちらになると思う。データはSQLやデータマートにあるものを使うし、サービスに適応するときはWebエンジニアの助けが必要。スキル的は機械学習の知識や統計学の知識を求められ、文系職とはいえほぼ全員プログラミングスキル、RやSASSPSSなどの統計言語およびSQLなどの知識を有することを求められる。

 

ビジネスインテリジェンスな人

主にExcelやPPTなどを使って意思決定用の資料の作成を行う人。とにかく数値をミスらずに出すことや数値を見続けても拒絶反応を起こさないことを求められる。ただし、多くのデータマイナーを自負している人間はこの業務を嫌っており、逆に多くのデータマイナーに仕事を依頼してくる人が求めている業務というアンバランスな存在。スキル的にはExcelの関数や高速でPPTを作成する力などに加えて、Excelというプラットフォーム上で動作するソリューションを使えると重宝される、VBAとかSQLサーバーとか、最近だとDataNitroとか面白いかもしれない。

 

データ分析コンサル的な人

(ちょっと番外編な業務だが)分析対象のKPI設計やBIツールの導入など分析に関するまとめの仕事をする人。その他の業種と比べるとどちらかというと営業に近い職業で各タスクを上記のどのタイプの人にふるかを考えたり、定義したりする。スキル的にはデータマイニングに関するTipsや最新の情報とかを知っていると重宝される。

 

 

正直、上記の業務区分が一般的なのかも、日本だけで世界的には違うのかとかわからないくらい、この業種は黎明期の業種だったりする。なので、別の働き方や価値の創出の仕方があることを知っている人がいたら、ぜひ教えてもらいたい。