自分のキャリアをあれこれ考えながら、Pythonで様々なデータを分析していくブログです
Data Analytics

クラスタリング・主成分分析・潜在クラス分析についてまとめてみた。

データ解析は、現代のビジネスや科学の世界において不可欠なスキルとなりました。多くの情報がデジタルフォーマットで蓄積され、これからの意思決定や洞察を導く際には、その情報から価値ある知見を引き出す能力が重要です。その中でも、クラスタリング、主成...
Data Analytics

(その2-3) Heart Disease(Cleveland)のデータセットで心臓病かどうかをAutoMLで予測してみた。

前回はニューラルネットワークを使ってモデリングをしました。 今回はAutoMLを使ってモデリングをしたいと思います。 AutoMLに慣れてしまうとインデータさえきちんとしていれば簡単に精度の出せるモデルが作成出来てしまうので、少し戸惑ってし...
Data Analytics

(その2-2) Heart Disease(Cleveland)のデータセットで心臓病かどうかをニューラルネットワークで予測してみた。

前回の記事ではロジスティック回帰で心臓病かどうかを当てるモデルを作成しました。 (その2-1) Heart Disease(Cleveland)のデータセットで心臓病かどうかをロジスティック回帰分析で予測してみた。 今回はKaggleのhe...
Data Analytics

(その2-1) Heart Disease(Cleveland)のデータセットで心臓病かどうかをロジスティック回帰分析で予測してみた。

前回Heart Disease(Cleveland)のデータ俯瞰を実施しました。 本記事では続きで下記を実施したいと思います。 モデリング用データの準備 モデリング モデリングでは心臓病かどうかを当てるモデルを作成したいと思います。 色々候...
Data Analytics

(その1) Heart Disease(Cleveland)のデータ俯瞰

このブログも幅広くデータ分析に関する情報をまとめて来ました。 Python環境構築からデータ操作の方法、機械学習でのモデル作成とディープラーニングによる物体検知まで手広くやってみました。 そろそろ原点である「様々なデータを分析する」に戻ろう...
Python

imgaugで画像のデータ拡張(data augumentation)を試してみる

データ拡張(Data Augmentation)は、機械学習やコンピュータビジョンにおいて使用される手法であり、既存の画像データに対して様々な変換や修正を行うことで、トレーニングデータセットのサイズと多様性を人工的に増やす手法です。データが...
Linux

Oracle Linuxでpam_faillock.soモジュールを使ったユーザーロック機能を試してみる

今回はpam_faillock.soモジュールを使って、ログインに失敗したときにアクセス制限をかける方法をまとめておきます。 The pam_faillock.so module maintains a list of failed aut...
English

エンジニアが英語でのミーティングを乗り越えるために必要な7つのこと (自己流)

ここで言っている「英語のミーティング」とは1対1や1対2くらいの小規模のチームミーティングを想定しています。 最近ちょくちょく英語でのミーティングが入りますが、相手の言っていることを100%理解しているとは言い難いし、自分の言いたいことを1...
Python

Mask R-CNNでAPを計算してみる

MaskRCNNによる物体検知を試してみるの記事の続きになります。 前回はdetectメソッドで物体検知を試しました。今回はAPの計算をしてみようと思います。 サンプルを確認するとutilsのcompute_apメソッドで実現可能そうです。...
Python

Mask R-CNNによる物体検知を試してみる

Mask R-CNN(Mask Region Convolutional Neural Network)は、物体検出とセグメンテーションのための深層学習モデルで、R-CNN(Region Convolutional Neural Netwo...