LoginSignup
2
0

More than 3 years have passed since last update.

機械学習を利用した不正検知サービス Amazon Fraud Detector を触ってみる

Posted at

こんにちは。
ナレッジコミュニケーション 繁松です。

この記事は株式会社ナレッジコミュニケーションが運営する Amazon AI by ナレコム Advent Calendar 2020 の 18日目にあたる記事になります。

本日は、機械学習を利用した不正検知サービスの[Amazon Fraud Detector]について書きたいと思います。

Amazon Fraud Detectorとは

AWSより引用

Amazon Fraud Detector は完全マネージドサービスであり、オンライン支払い詐欺や偽のアカウントの作成など、潜在的に不正なオンラインアクティビティを簡単に識別できます。
Amazon Fraud Detector は、機械学習 (ML) と AWS およびAmazon.com の 20 年にわたる不正検出の専門知識を使用して、不正行為の可能性を自動的に特定し、より多くの不正行為を迅速に発見できるようにします。
Amazon Fraud Detector は、数回クリックするだけで、ML の経験がまったくない不正検出モデルを作成できます。
これは、Amazon Fraud Detector がすべての ML の手間のかかる作業を処理するためです。

機械学習の知識が無い人でも簡単に詐欺、偽のアカウント作成等の不正検知を取り入れることができるフルマネージドサービスです。

Amazon Fraud Detectorを使ってみた

実際に使ってみたいと思います。
手順は以下の手順になります。

AWSブログより引用

ステップ 1: 不正行為について評価したいイベントを定義する。
ステップ 2: 履歴的なイベントデータセットを Amazon S3 にアップロードして、不正検出モデルタイプを選択する。
ステップ 3: Amazon Fraud Detector が履歴データを入力として使用し、カスタムモデルを構築する。
           このサービスは、自動的にデータを調べてリッチ化し、特徴量エンジニアリングを実行して、アルゴリズムの選択、およびモデルのトレーニングと調整を行い、モデルをホストします。
ステップ 4: モデルの予測に基づいて受け入れる、レビューする、またはより多くの情報を収集するかどうかのルールを作成する。
ステップ 5: オンラインアプリケーションから Amazon Fraud Detector API を呼び出して、リアルタイムの不正行為予測を受け取り、設定された検出ルールに基づいて措置を講じる。 
           (例: e コマースアプリケーションは、E メールと IP アドレスを送信し、不正行為スコアとルールからの出力 (例: レビュー) を受け取ることができます)

数クリックで簡単に?とは行かなそうですが、実際にやってみたいと思います。
今回は公式のチュートリアルの「パートA:Amazon Fraud Detectorモデルを構築」を参考に進めて行きます。

1. サンプルのトレーニングデータの取得、アップロード

AWS公式の架空のトレーニングデータを以下のURLよりダウンロードします。
ダウンロードはこちら

次にS3バケットにトレーニングデータをアップロードします。
※今回amazon-fraud-detector-testというバケットを作成しています。
※Zipファイルには、[registration_data_20K_full.csv]と[registration_data_20K_minimum.csv]が入っています。
S3とAmazon Fraud Detectorのリージョンは同じリージョンにする必要があります。
画像2.jpg

今回は[registration_data_20K_minimum.csv]をアップロードします。
画像1.jpg

ファイルの中身はこのような感じです。
画像3.jpg

2. イベント作成

実際にAmazon Fraud Detectorにイベントを作成していきます。
東京リージョンは2020年12月18日現在、未対応ですので、、バージニア北部リージョンに作成します。
画像4.jpg

エンティティを作成し、選択します。
画像5.jpg

[トレーニングデータセットから変数を選択する]を選択し、IAMロールの作成を行います。
IAMロール名は先程作成したS3バケット名と同じ名前にします。
画像6.jpg

先程アップロードしたcsvファイルのS3 URLを入力しアップロードを行い、
表示された変数の変数型を指定します。
画像7.jpg

ラベルを少なくとも2つ定義する必要があるので、
[fraud]と[legit]を定義し、イベントタイプの作成を行います。
画像8.jpg

3. モデル作成

イベントタイプ作成が完了したら、モデルの作成を行います。
画像9.jpg

イベントタイプは先程作成したものを選びます
画像10.jpg
画像11.jpg

トレーニングの設定不正ラベル正当ラベルを選択します。
画像12.jpg

モデルはデータのサイズに応じて30~40分から数時間かかるそうです。
画像13.jpg

生成後はパフォーマンスメトリクスの確認と、モデルのデプロイができるようになります。
2020-12-18_18h14_58.jpg
2020-12-18_18h14_21.jpg

Amazon Fraud Detectorを取り入れた運用を考え、不正アクセスなどを防ぎたいですね。
以上 Amazon Fraud Detectorについてでした。

参考文献
https://aws.amazon.com/jp/fraud-detector/features/
https://aws.amazon.com/jp/blogs/news/amazon-fraud-detector-is-now-generally-available/

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0