taka5hi’s blog

統計と機械学習の話題をメインに記事を書いています。

2019-05-01から1ヶ月間の記事一覧

機械学習アルゴリズム:XGBoost の仕組みとパラメーター

XGBoost は、アンサンブル学習の一種であるブースティングを利用した手法及び実装です。 アンサンブル学習とは、複数のモデル(弱学習器)を組み合わせて、より強力なモデルを作る手法のことです。 XGBoost は、性能的にも優れており、たびたびコンペの上位…

Kaggle Titanic コンペ:分析の枠組み構築

こちらの記事にも書いたとおり、昨年末から Kaggle のコンペに参加し始めました。 しかし、なんとなく EDA (Explanatory Data Analysis: 探索的データ解析) を行うものの次第に発散していってしまうことがよくあります。 そこで、基本的な EDA を行ったうえ…