dataminer.me

データマイニングやその周辺のお話を書くブログ

バイト。

オンラインゲーム(MMOとFPSの双方)のアクセスログとか顧客データの

データマイニングのバイトをやることになりそう。


「相関とかって分かる?」とか「回帰分析って知ってる?」って聞かれた。

普通の大学生(自分が普通かは別として)って知らないのかも。


とりあえず、バイトまでにPython

0.ユーザーの属性を任意の閾値でラベル化する関数

1.特定の列を指定して、全部のデータと相関をとる関数

2.列に対して、重回帰分析をかけて、変数選択(AICとか)をする関数

3.2変量以上のデータに使えるt検定・分散分析+多変量の差の検定の関数

を作っておけば、十分かな。できれば、GUI→exe化までできたら、ベスト。


以前、作っておいたやつがrpyバージョンで使えないから

rpy2バージョンで書き直しておこう。

思ったよりもrpy→rpy2はめんどくさそうだ。