自分のキャリアをあれこれ考えながら、Pythonで様々なデータを分析していくブログです

mljar

Data Analytics

(その4-8) エイムズの住宅価格をAutoML(mljar)で予測してみた

今回はAutoMLを試してみたいと思います。AutoMLは今のところ3種類の環境を用意しているのですが本記事ではMLJARというAutoMLライブラリをエイムズのデータセットに試してみたいと思います。 MacでAutoMLの環境をする方法は...
Data Analytics

(その4-12) タイタニックの乗客の生存有無をAutoMLで予測してみたまとめ

タイタニックのデータセットで色々なモデルを作成してきました。 精度がよかったモデルは全てAutoMLを使ったものでした。 今までは欠損値処理・変数選択・特徴量エンジニアリングをした訓練データの一部を使ってモデリングをしていました。 (混合行...
Data Analytics

(その4-9) タイタニックの乗客の生存有無をAutoML(mljar)で予測してみた

前回はXgBoostで分類モデルを作成しました。 暫定1位はロジスティック回帰CVで作成してモデルで、Kaggleの精度は0.76794です。 今回はAutoMLを試してみようと思います。 色々なモデルを作成して一番良い精度のものを探索して...
Python

(MLJAR) Pythonで3つのAutoML環境を用意してみた

AutoMLは機械学習のプロセス(データ加工〜モデル作成〜ハイパーパラメータチューニング)を全て自動実行してくれるツールになります。 有名なものだと、DataRobotというツールがありますが有償になります。 Pythonで無償で使えるもの...