はじめに
私はお仕事で、顧客(お医者さん)にメールを送ることがあるのですが、
「あれ、この医師は朝型なのか、夜型なのか・・?
どのタイミングでメール送ったらより開封してくれるのだろうか・・」
と悩むことがあります。
ということで、
事前情報をもとに、気になるあの人が朝型か夜型か機械学習を用いて予測してみました!
事前準備
表形式であらかじめわかっている18名の情報をcsvファイル化
日本語で入力していたら途中でエラーが起きたので、今回は数字に直しました。。
性別 1=女 2=男
診療科 1=内科 2=外科
これをもとに、機械に傾向をつかませます。
Googlecolabを使用し、コード入力
①まずはマウント
from google.colab import drive
drive.mount('/content/drive')
②pandsインポート
import pandas as pd
③csvファイル読み込み
df = pd.read_csv('/content/drive/MyDrive/pandascsv/mornignornight.csv')
df.head(3)
ちゃんと読み込めている。
データの前処理
④特徴量を指定
xcol = ['性別','診療科','年代']
x = df[xcol]
x
特微量についてはこの記事がわかりやすかったです。
⑤正解データを指定
t = df['朝型か夜型か']
t
モデルの準備、そして実行(学習)
⑥モデルを学習させる
from sklearn import tree
model = tree.DecisionTreeClassifier(random_state=0)
model.fit(x, t)
エラーが出ていなければOK
予測
⑦予測させるのは、Aドクターで、
性別:女性、診療科:内科、年代:40代
女性は1 内科は1 だったため、数字で情報を入力。
#Adrは女性・内科・40代
Adr = [[1 ,1 ,40 ]]
model.predict(Adr)
夜型って書いてある!!!
ということで、
夜にメール送ろう...
自分の仕事にいかすことができそうです!
最後に
もっと情報量多ければ、より正確なものができると思いますし、
朝型夜型の2択だけではなく、細かく1時間単位とかで比較的空いている時間を予測させてみても面白いかも!!と思いました。
また、気になるあの人は
「インドア派なのか、アウトドア派なのか・・・」「きのこの山派なのか、たけのこの里派なのか・・・」
「白米かパンか麺何が好きな傾向があるのか・・」
など事前情報さえあれば、予測がさまざまにできるかもです。
これ、本当に簡易的な情報だけでやってみましたが、
当初、機械学習ってなんぞや... と、ちんぷんかんぷんだった私も、
自分でGoogleコラボでコード入力してみたら予測の流れが少し理解できた気がしました!