自分のキャリアをあれこれ考えながら、Pythonで様々なデータを分析していくブログです

2022-08

Python

MacでSIGNATEのデータをターミナルでやり取りする

Kaggleの日本語版のようなサービスでSIGNATEというサービスがあります。 何か違う名前だったような気がするので調べたら、昔はDeepAnalyticsという名称だったようです。どうやらヒノマルクはDeepAnalyticsという名称...
Data Analytics

(その4-10) エイムズの住宅価格をAutoML(auto-sklearn)で予測してみた

今回はauto-sklearnを試してみたいと思います。 バージョンは0.14.7でまだ22年8月現在は最新版をインストール済みですので、アップグレードはしません。 MacでAutoMLの環境をする方法は下記記事にまとめています。pipでイ...
Data Analytics

(その4-9) エイムズの住宅価格をAutoML(AutoGluon)で予測してみた

今回はAutoGluonというAutoMLライブラリをエイムズのデータセットで試してみます。 MacでAutoMLの環境をする方法は下記記事にまとめています。pipでインストールしているのがほとんどですので、Linuxでも同じようなコードで...
Data Analytics

(その4-8) エイムズの住宅価格をAutoML(mljar)で予測してみた

今回はAutoMLを試してみたいと思います。AutoMLは今のところ3種類の環境を用意しているのですが本記事ではMLJARというAutoMLライブラリをエイムズのデータセットに試してみたいと思います。 MacでAutoMLの環境をする方法は...
Data Analytics

(その4-7) エイムズの住宅価格をXGBoostで予測してみた パート2

前回はデフォルト設定のXGBoostを試しました。 今回はランダムサーチという手法でパラメータチューニングをしたいと思います。 instead of testing every combination of hyperparameters,...
Data Analytics

(その4-7) エイムズの住宅価格をXGBoostで予測してみた パート1

今回はXGBoostになります。 SVRではグリッドサーチ、ランダムフォーレストではベイズ最適化を試しましたのでXGBoostではランダムサーチという手法でパラメータチューニングをしたいと思います。 本記事ではデフォルト設定で試した結果をま...
Data Analytics

(その4-6) エイムズの住宅価格をランダムフォーレストで予測してみた パート2

今回は前回の続きでランダムフォーレスト(random forest)のパラメータチューニングをベイズ最適化(Bayesian Optimization)で行いたいと思います。 色々と調べている中、ベイズ最適化はグリッドサーチのように総当たり...
Data Analytics

(その4-6) エイムズの住宅価格をランダムフォーレストで予測してみた パート1

今回はランダムフォーレスト(random forest)になります。 旧ブログでも割とアクセスがあった手法になります。 大学の授業や会社での勉強などでとりあえず使ってみたいという方は上から順に実行すれば動くはずですのでぜひお試しください。 ...
Data Analytics

(その4-5) エイムズの住宅価格をサポートベクター回帰(SVR)で予測してみた

今回はサポートベクター回帰(SVR)になります。 サポートベクターマシーン(SVM)はよく聞きますが、SVRはSVMを回帰問題に適用したものであるようです。 詳細は「Unlocking the True Power of Support V...
Data Analytics

(その4-4) エイムズの住宅価格をニューラルネットワークで予測してみた

今回はニューラルネットワークになります。 今だとディープラーニングの方が聞いたことがある方の方が多いでしょうか? ディープラーニングはニューラルネットワークを多層化することにより高精度を出すことを可能にした手法のようです。 ディープラーニン...