自分のキャリアをあれこれ考えながら、Pythonで様々なデータを分析していくブログです

prepare-for-analytics

Python

Google ColabのGPU環境でGPU版torchとGPU版mxnetの動作確認をしてみた。

本記事では、今後ディープラーニング系のライブラリを使っていこうと思っている中でGPUを使える環境を準備したかったので、Google ColaboratoryのGPU環境の確認とGPU版のtorchとmxnetというライブラリを使ってみた結果...
Python

MacでSIGNATEのデータをターミナルでやり取りする

Kaggleの日本語版のようなサービスでSIGNATEというサービスがあります。 何か違う名前だったような気がするので調べたら、昔はDeepAnalyticsという名称だったようです。どうやらヒノマルクはDeepAnalyticsという名称...
Python

Google Colaboratoryについて調べてみた

今回はウェブ上で分析作業が出来てしまうGoogle社のColaboratoryというサービスを見てみます。 Colab(正式名称「Colaboratory」)では、ブラウザ上で Python を記述、実行できます。以下の機能を使用できます。...
Data Analytics

データ分析のデータ加工パートでやる5つのこと

データの理解が進んだら次はデータの加工作業に入ります。 具体的にやる事を洗い出してみました。 主な作業としては下記が考えられます。 欠損値処理 (missing value processing) 外れ値処理 (outlier proces...
Data Analytics

データマイニングのフレームワークであるCRISP-DMとは

ヒノマルク データマイニングを教わったときにCRISP-DMが基本概念にありました。ClementineというIBMのSPSS Modelerの前身のデータイニングツールで分析キャリアを始めました。ClementineでCRISP-DMが導...
Python

Macでkaggleのデータをターミナルからダウンロードできるようにする

ヒノマルク ここまでの記事でデータの読み込みから加工方法まで基本的なところを学べてきたと思います。 今回から様々なデータを使ってデータ分析をしていきたいなと思っています。 分析データの取得元の一つにKaggleというコンペサイトがあります。...