Data Analytics (その4-8) エイムズの住宅価格をAutoML(mljar)で予測してみた 今回はAutoMLを試してみたいと思います。AutoMLは今のところ3種類の環境を用意しているのですが本記事ではMLJARというAutoMLライブラリをエイムズのデータセットに試してみたいと思います。 MacでAutoMLの環境をする方法は... 2022.08.07 Data Analytics
Data Analytics (その4-12) タイタニックの乗客の生存有無をAutoMLで予測してみたまとめ タイタニックのデータセットで色々なモデルを作成してきました。 精度がよかったモデルは全てAutoMLを使ったものでした。 今までは欠損値処理・変数選択・特徴量エンジニアリングをした訓練データの一部を使ってモデリングをしていました。 (混合行... 2022.06.10 Data Analytics
Data Analytics (その4-9) タイタニックの乗客の生存有無をAutoML(mljar)で予測してみた 前回はXgBoostで分類モデルを作成しました。 暫定1位はロジスティック回帰CVで作成してモデルで、Kaggleの精度は0.76794です。 今回はAutoMLを試してみようと思います。 色々なモデルを作成して一番良い精度のものを探索して... 2022.06.04 Data Analytics
Python (MLJAR) Pythonで3つのAutoML環境を用意してみた AutoMLは機械学習のプロセス(データ加工〜モデル作成〜ハイパーパラメータチューニング)を全て自動実行してくれるツールになります。 有名なものだと、DataRobotというツールがありますが有償になります。 Pythonで無償で使えるもの... 2022.06.03 Python