自分のキャリアをあれこれ考えながら、Pythonで様々なデータを分析していくブログです

impyla

Python

hiveのデータをpandasに読み込んでみる

ヒノマルク 今回はhiveのデータをpandasのデータフレームに読み込めるようにします。 hiveを使うということはかなり大きなデータを扱っていると思います。 データクリーニングやサマリデータの作成はなるべくhive側でさせてからpyth...
Python

Pythonからimpylaでhiveを操作してみる

ヒノマルク どうもヒノマルクです。今日はhiveへのアクセスになります。 最近だとBigQueryに移行している企業もいるかと思いますが、まだまだ現役でゾウさんとハチさんに頑張ってもらっている企業も多いのではないでしょうか? ヒノマルクは業...