edX

【Kaggle】Googleの売上を予測して賞金ゲット?

こんにちは、ナスビーニョです。今回は、Kaggleで開催されている大会が面白そうなので紹介していきます。

Kaggleとは

Kaggleとはwikipediaでは以下のように説明されています。

Kaggleは企業や研究者がデータを投稿し、世界中の統計家やデータ分析家がその最適モデルを競い合う、予測モデリング及び分析手法関連プラットフォーム及びその運営会社である。-wikiepdia-

もう少し簡単にいうと、企業が提供するデータを使ってより良い予測モデルを作る大会が開かれるプラットフォームです。

また多くの大会で賞金が設けられているので、世界中からガチガチのデータサイエンティストが集まってきます。また、企業は優秀なチームに採用の電話をかけることもあるみたいです。

双方にとっても魅力な場所となっています。

そんなKaggleでGoogleの売上(正確にはgoogle merchandiseの売上)を予測するモデルを作る大会が開催されています。

Kaggleは2017年にGoogleに買収されたことでも知られていますよね(笑)。早速プロジェクトをどんどん出しているみたいです。

それでは概要を見ていきましょう。

大会の概要

サイトには以下のリンクから飛ぶことが出来ます。

https://www.kaggle.com/c/google-analytics-customer-revenue-prediction

タイトル: Google Analytics Customer Revenue Prediction 

大会期間:9月13日~11月15日(ただし、エントリー11月8日まで)

賞金:1位 $12,000, 2位 $8,000, 3位 $5,000

特別賞: 1位 10,000, 2位 $7,000, 3位 $3,000 (Rでモデルを作ったチームのみが対象)

概要:Google Analyticsの顧客データを使い、顧客あたりの収益予測の精度を競う

チーム最大人数:8名まで

提出上限:5回まで(最終的に評価してもらうように2つを選ぶ必要あり)

評価方法

制度評価指標の一つであるRMSEで評価が決まります。

この場合Ýは予測値、yは実際の個人の収益の値となっています。これによってモデルから算出された予測値とモデルがどれだけ乖離しているのか見ることが出来ます。

勝利するコツは?

勝利するコツは、如何に。特に、僕のような新参者にはほぼ勝ち目はないかもしれません。

しかし、Kaggleにはとても良い機能が付いています。

Kernelsという所に自分のコーディングを載せてくれているのです。初心者はこれを利用するしかありません。最初は見よう見真似でもいいので、一つ一つ自分で実際にしていくことが大事だと思います。

言うは易く行うは難し、なので僕も頑張ってKernelsにあるものを参考にしてオリジナルのものを作れるレベルに行きたいです。

機械学習を一から学び始める人はこちらのコースが今やっているのでおすすめかもしれません。

あわせて読みたい
社会科学のためのデータサイエンスを勉強するこんにちは、ナスビーニョです。今回は、昨今の社会科学に必要なデータサイエンスが学べる講座をインターネット上で見つけたので紹介していきます...