2019-01-01から1年間の記事一覧
昨日 (2019/06/08) に、マイクロソフト様などの企業が主催するコミュニティー DEEP LEARNING LAB の 2 周年イベントに参加してきました。 というのもここ1ヶ月ほど、対応しなければいけないことができてしまい機械学習の勉強にあまり時間を割くことができて…
XGBoost は、アンサンブル学習の一種であるブースティングを利用した手法及び実装です。 アンサンブル学習とは、複数のモデル(弱学習器)を組み合わせて、より強力なモデルを作る手法のことです。 XGBoost は、性能的にも優れており、たびたびコンペの上位…
こちらの記事にも書いたとおり、昨年末から Kaggle のコンペに参加し始めました。 しかし、なんとなく EDA (Explanatory Data Analysis: 探索的データ解析) を行うものの次第に発散していってしまうことがよくあります。 そこで、基本的な EDA を行ったうえ…
機械学習の線形モデルについてまとめています。 データ分析などにも広く使われる手法で、アルゴリズムにかなりのバリエーションがありますが、この記事では代表的なものをまとめています。
今年の初めに自宅の Deep Learning 用環境を壊してしまいました。 原因は、不用意に Python モジュールのバージョンを変更してしまったことなんですが、なんだかんだで復旧に数時間かかってしまいました。 この経験から、Deep Learning 環境を Docker 化する…
機械学習では、時にはメモリに収まりきらないほどの大量のデータを扱う必要があります。 データを準備・加工する処理がボトルネックにならないようにするためには、例えば以下のような工夫が必要になります。 複数のデータをまとめて単一のファイルに保存す…