LoginSignup
2
0

More than 3 years have passed since last update.

Amazon SageMaker IP Insights アルゴリズムを試してみる

Last updated at Posted at 2018-12-16

Amazon AI by ナレコム Advent Calendar 2018の16日目の記事です。
今日は、Amazon SageMaker IP Insights アルゴリズムを試してみました。
IP Insights アルゴリズムは、IPアドレスの異常な動作や使用パターンを検出するものです。
チュートリアルがあるので、実行してみましょう。

ノートブックインスタンスの作成

1.AWS Consoleを開き、SageMakerを開きます。
2.左のメニューのノートブック->ノートブックインスタンスを選択し、ノートブックインスタンスの作成をクリックして新規作成します。
ipinsights01.PNG
3.ステータスがInServiceになったら、アクションにある開く Jupyterをクリックして、Jupyterを開きます。

Jupyterの作成

1.SageMaker Examplesタブをクリックし、Introduction to Amazon Algorithmsを展開します。
2.ipinsights-tutorial.ipynbの右側にあるUseをクリックし、Create Copyをクリックしてチュートリアルのコピーを作成します。
3.S3を作成します。バケット名は、sagemaker-ipinsights-testとしました。
ipinsights05.PNG
4.作成したS3を指定します。
ipinsights06.PNG

データセットの準備

1.データセットをインストールします。
ipinsights07.PNG

2.ファイルを読み込みます。
ipinsights08.PNG

3.タイムスタンプをDateTimeオブジェクトに変換します。
ipinsights09.PNG

4.タイムゾーンの一致を確認します。
ipinsights10.PNG

5.タイムゾーンの処理をします。
ipinsights11.PNG

6.リソースを選択します。
ipinsights12.PNG

7.ユーザーとIPアドレスを抽出します。
ipinsights13.PNG

8.学習とテストのデータセットを作成します。
ipinsights14.PNG

9.10日間のログイベントを使用し、7日間を学習、3日間をテストとします。
ipinsights15.PNG

10.学習データをシャッフルします。
ipinsights16.PNG

学習

1.S3に格納します。
ipinsights17.PNG

2.イメージを取得します。
ipinsights18.PNG

3.学習します。
ipinsights19.PNG
ipinsights20.PNG

推論

1.エンドポイントを作成します。
ipinsights21.PNG
ipinsights22.PNG

2.データのシリアライズ/デシリアライズ
ipinsights23.PNG

3.dot_productを表示します。
ipinsights24.PNG

異常検出スコアの計算

1.通常のトラフィックデータセットを使用します。
ipinsights25.PNG

2.異常のトラフィックデータセットを挿入します。
ipinsights26.PNG

ipinsights27.PNG

分布の表示

ipinsights28.PNG
ipinsights29.PNG
ipinsights30.PNG

閾値が0.0の場合、103390件の中、98394件が異常と予測してます。
精度は95%となりました。

まとめ

Amazon SageMaker IP Insights アルゴリズムを試してみました。
独自のデータセットでやってみたいですね。

参考文献

[1] Amazon SageMaker IP Insights アルゴリズムを使用して、不審な IP アドレスを検出する

2
0
1

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0