機械学習を利用した不正検知サービス Amazon Fraud Detector を触ってみる

Posted at 2020-12-18

こんにちは。
ナレッジコミュニケーション　繁松です。

この記事は株式会社ナレッジコミュニケーションが運営する Amazon AI by ナレコム Advent Calendar 2020 の 18日目にあたる記事になります。

本日は、機械学習を利用した不正検知サービスの[Amazon Fraud Detector]について書きたいと思います。

Amazon Fraud Detectorとは

AWSより引用

Amazon Fraud Detector は完全マネージドサービスであり、オンライン支払い詐欺や偽のアカウントの作成など、潜在的に不正なオンラインアクティビティを簡単に識別できます。
Amazon Fraud Detector は、機械学習 (ML) と AWS およびAmazon.com の 20 年にわたる不正検出の専門知識を使用して、不正行為の可能性を自動的に特定し、より多くの不正行為を迅速に発見できるようにします。
Amazon Fraud Detector は、数回クリックするだけで、ML の経験がまったくない不正検出モデルを作成できます。
これは、Amazon Fraud Detector がすべての ML の手間のかかる作業を処理するためです。

機械学習の知識が無い人でも簡単に詐欺、偽のアカウント作成等の不正検知を取り入れることができるフルマネージドサービスです。

Amazon Fraud Detectorを使ってみた

実際に使ってみたいと思います。
手順は以下の手順になります。

AWSブログより引用

ステップ 1: 不正行為について評価したいイベントを定義する。
ステップ 2: 履歴的なイベントデータセットを Amazon S3 にアップロードして、不正検出モデルタイプを選択する。
ステップ 3: Amazon Fraud Detector が履歴データを入力として使用し、カスタムモデルを構築する。
           このサービスは、自動的にデータを調べてリッチ化し、特徴量エンジニアリングを実行して、アルゴリズムの選択、およびモデルのトレーニングと調整を行い、モデルをホストします。
ステップ 4: モデルの予測に基づいて受け入れる、レビューする、またはより多くの情報を収集するかどうかのルールを作成する。
ステップ 5: オンラインアプリケーションから Amazon Fraud Detector API を呼び出して、リアルタイムの不正行為予測を受け取り、設定された検出ルールに基づいて措置を講じる。 
           (例: e コマースアプリケーションは、E メールと IP アドレスを送信し、不正行為スコアとルールからの出力 (例: レビュー) を受け取ることができます)

数クリックで簡単に？とは行かなそうですが、実際にやってみたいと思います。
今回は公式のチュートリアルの「パートA：Amazon Fraud Detectorモデルを構築」を参考に進めて行きます。

1. サンプルのトレーニングデータの取得、アップロード

AWS公式の架空のトレーニングデータを以下のURLよりダウンロードします。
ダウンロードはこちら

次にS3バケットにトレーニングデータをアップロードします。
※今回amazon-fraud-detector-testというバケットを作成しています。
※Zipファイルには、[registration_data_20K_full.csv]と[registration_data_20K_minimum.csv]が入っています。
S3とAmazon Fraud Detectorのリージョンは同じリージョンにする必要があります。