自分のキャリアをあれこれ考えながら、Pythonで様々なデータを分析していくブログです

hinomaruc

Python

Google ColabのGPU環境でAutoGluonのTime Series Forecasting機能を試してみる

本記事ではGoogle ColaboratoryのGPU環境でAutoMLライブラリであるAutoGluonをインストールし、Times Series Forecastingの機能が動作するところまでを確認していきます。 AutoGluon...
Python

Google ColabのGPU環境でGPU版torchとGPU版mxnetの動作確認をしてみた。

本記事では、今後ディープラーニング系のライブラリを使っていこうと思っている中でGPUを使える環境を準備したかったので、Google ColaboratoryのGPU環境の確認とGPU版のtorchとmxnetというライブラリを使ってみた結果...
Data Analytics

(その1) アップル引越しの需要予測の分析計画

今回から時系列データの分析に入りたいと思います。 データはSIGNATE社のデータ分析コンペでダウンロード出来る、アップル引っ越しセンターの引越し実績を利用したいと思います。 アップル引っ越しセンターは下記サイトになります。 IT化によって...
Python

MacでSIGNATEのデータをターミナルでやり取りする

Kaggleの日本語版のようなサービスでSIGNATEというサービスがあります。 何か違う名前だったような気がするので調べたら、昔はDeepAnalyticsという名称だったようです。どうやらヒノマルクはDeepAnalyticsという名称...
Data Analytics

(その4-10) エイムズの住宅価格をAutoML(auto-sklearn)で予測してみた

今回はauto-sklearnを試してみたいと思います。 バージョンは0.14.7でまだ22年8月現在は最新版をインストール済みですので、アップグレードはしません。 MacでAutoMLの環境をする方法は下記記事にまとめています。pipでイ...
Data Analytics

(その4-9) エイムズの住宅価格をAutoML(AutoGluon)で予測してみた

今回はAutoGluonというAutoMLライブラリをエイムズのデータセットで試してみます。 MacでAutoMLの環境をする方法は下記記事にまとめています。pipでインストールしているのがほとんどですので、Linuxでも同じようなコードで...
Data Analytics

(その4-8) エイムズの住宅価格をAutoML(mljar)で予測してみた

今回はAutoMLを試してみたいと思います。AutoMLは今のところ3種類の環境を用意しているのですが本記事ではMLJARというAutoMLライブラリをエイムズのデータセットに試してみたいと思います。 MacでAutoMLの環境をする方法は...
Data Analytics

(その4-7) エイムズの住宅価格をXGBoostで予測してみた パート2

前回はデフォルト設定のXGBoostを試しました。 今回はランダムサーチという手法でパラメータチューニングをしたいと思います。 instead of testing every combination of hyperparameters,...
Data Analytics

(その4-7) エイムズの住宅価格をXGBoostで予測してみた パート1

今回はXGBoostになります。 SVRではグリッドサーチ、ランダムフォーレストではベイズ最適化を試しましたのでXGBoostではランダムサーチという手法でパラメータチューニングをしたいと思います。 本記事ではデフォルト設定で試した結果をま...
Data Analytics

(その4-6) エイムズの住宅価格をランダムフォーレストで予測してみた パート2

今回は前回の続きでランダムフォーレスト(random forest)のパラメータチューニングをベイズ最適化(Bayesian Optimization)で行いたいと思います。 色々と調べている中、ベイズ最適化はグリッドサーチのように総当たり...