目次
第1章 分析コンペとは?
第2章 タスクと評価指標
第3章 特徴量の作成
第4章 モデルの作成
第5章 モデルの評価
第6章 モデルのチューニング
第7章 アンサンブル
付録
著者等紹介
門脇大輔[カドワキダイスケ]
京都大学総合人間学部卒業後、生命保険会社でアクチュアリーとして10年ほど商品開発・リスク管理などに従事した後、Kaggleや競技プログラミングで学んだ技術で仕事をするようになった。Kaggle Competitions Master(Walmart Recruiting 2:Sales in Stormy Weather優勝、Coupon Purchase Prediction3位)、日本アクチュアリー会正会員
阪田隆司[サカタリュウジ]
2012年に京都大学大学院修了後、国内電機メーカーに入社。以来、データサイエンティストおよび研究員として従事。仕事柄、データサイエンス・機械学習に興味を持ち、2014年よりKaggleを始め、2019年にKaggle Competitions Grandmasterとなる
保坂桂佑[ホサカケイスケ]
東京大学大学院総合文化研究科広域科学専攻で天体シミュレーションの研究で修士号を取得後、データ分析のコンサルティング企業で、10年近く企業のデータ分析支援に携わった。その後大手Webサービス企業に入社し、データ活用の推進に携わったあと、現在はデータサイエンティストや機械学習エンジニアの育成、マネジメントに従事。Kaggle Competitions Expert
平松雄司[ヒラマツユウジ]
東京大学理学部物理学科卒業、同大学大学院理学研究科物理学専攻修了後、国内電機大手に就職した後、金融業界へと転身し、金融システム会社にてデリバティブクオンツ、国内大手損保グループにてリスクアクチュアリー業務に携わった。現在は、アクサ生命保険株式会社にてシニアデータサイエンティストとして社内のデータ分析の促進に従事。また、東京大学へ研究員としても出向中で、医療データの分析・研究を行っている。日本アクチュアリー会準会員。2018年にKaggle Competitions Masterとなっている(本データはこの書籍が刊行された当時に掲載されていたものです)
出版社内容情報
データサイエンスの認知の高まりとともに、データ分析に関するコンペティションが多数開催されるようになってきました。最も有名なコンペティションプラットフォームであるKaggleにおけるプレイヤー数は10万人を超え、多くのエンジニアが自分の腕を試すためにコンペティションに参加しています。分析コンペでは、実際のデータを扱うため、機械学習の解説書にはあまり載っていないような手法やテクニックが数多く活用されています。これらを理解し自身で使えるようにしておくことはコンペだけでなく、実務でのモデル構築において非常に役に立ちます。
そこでこれらのテクニックや事例を多くの人に知っていただくために、現時点で最新のものを整理して本書にまとめました。特徴量の作り方、バリデーション、パラメータチューニングなどについて、一般的な書籍ではあまり言及されない暗黙知やポイントについて記述しています。分析コンペにこれから参加してみたい方、あるいはもっと上を目指したい方だけでなく、実務で予測モデルの精度を上げたいという方にも参考になる情報が多いでしょう。