先日、アマゾンウェブサービスジャパン合同会社が主催する勉強会に参加しました!
内容はAWSが提供する機械学習サービスについてで、今回はAmazonSageMakerの話でした。
ノーコードで機械学習が利用できるということなので、早速試してみようと思います!
前提
・AWSアカウント作成済み
・基本的なAWS操作ができる
初期設定
Amazon SageMaker Canvasを使うには、最初にユーザー・ドメイン・S3バケットを作成していきます。
左側のメニューからCanvasを選択。
デフォルトのまま送信。
適当にVPCとサブネットを選択し、保存して続行。
SageMaker Domain作成が完了するまで数分かかる。
以下のようなエラーが出るのですが、ページを読み込み直すと消える。
ユーザーが作成されたので「アプリケーションの起動」からCanvasを選択。
数分の待ち時間の後、Canvas専用画面が立ち上がる。
サンプルデータ入手
次にサンプルデータを用意しておきます。(分析したいデータがある人は飛ばしてOK)
S3経由でCSVをアップロードするのが一番楽なので、そのやり方で行きます!
以下で簡単にサンプルデータを用意できました。
感謝ですm(_ _)m
http://kazina.com/dummy/
データインポート
学習用のデータをインポートします。
自動で作成されたS3バケットの名前を以下で確認し、S3バケットにCSVデータをアップロードしておく。
左メニューの「Datasets」→「+ Import」
「+ New model」を選択し、モデル名を決めたら「Create」。
説明ダイアログボックスを閉じて、「Import data to Canvas」を選択。
バケットから該当のCSVデータをチェックし、「Import data」を選択。
数秒でStatusが「Ready」になるので、押下するとデータの確認ができる。
機械学習を開始
「Select dataset」で、どの列を分析するかを選ぶ。
今回は「婚姻」に設定し、「Quick build」を選択。
学習が始まり、数分後に以下のような結果が出る。
精度が84.5%で、「婚姻」には「年齢」が最も大きな影響を与えていることがわかりました。
適当に作成したサンプルデータの割には、とても現実的な結果が出ました!
予測
先程のモデルを利用して、新しいデータの婚姻を予測してみました。
5歳に設定したのに既婚か・・
作成されたモデルを見る限り年齢が高いほど、既婚になりそうな気がしたのですが^^;
終わりに
今回はAmazon SageMaker Canvasを使ってみました。
ノーコードで手軽に利用はできますが、元データがとても重要なので、実務で利用する前に多少のお勉強は必要かな〜と思いました。