自分のキャリアをあれこれ考えながら、Pythonで様々なデータを分析していくブログです

hive

Python

hiveのデータをpandasに読み込んでみる

ヒノマルク 今回はhiveのデータをpandasのデータフレームに読み込めるようにします。 hiveを使うということはかなり大きなデータを扱っていると思います。 データクリーニングやサマリデータの作成はなるべくhive側でさせてからpyth...
Python

Pythonからimpylaでhiveを操作してみる

ヒノマルク どうもヒノマルクです。今日はhiveへのアクセスになります。 最近だとBigQueryに移行している企業もいるかと思いますが、まだまだ現役でゾウさんとハチさんに頑張ってもらっている企業も多いのではないでしょうか? ヒノマルクは業...
Database

[docker] cloudera quickstartを使ってhive環境を準備する方法

ヒノマルクです。BigQueryやHiveなどのデータをPythonで読み込んでいる方も多いと思います。 今回はHadoop環境をお手軽に試せるclouderaのquick startイメージを使ってhiveを実行できる環境を準備しようと思...