はじめに
この記事は株式会社ナレッジコミュニケーションが運営する Amazon AI by ナレコム Advent Calendar 2018 の22日目の記事になります。
re:Invent 2018で発表された新しいマネージド型のAIサービスである Amazon Forecast について概要とどんなことが出来るかを調べていきます。
2018年12月17日時点では米国東部(バージニア北部)と米国西部(オレゴン)リージョンのみでPreview申請を受け付けている段階ですので、「 AWS ML University 」にて公開されている動画の紹介をしていきたいと思います。
コンテンツへのアクセス方法はこちらに記載しています。
「 Introduction to Amazon Forecast 」
In This Course
今回紹介する動画の主な内容は、以下の構成となります。
Service Introduction
需要・雇用・景気動向・自動車台数といった将来について予測する際、私達は主に過去の時系列データをもとに予測をします。その際に一番重要になるのはデータの「正確さ」です。
データの正確さは利益やコストに直結するものなので、正確であることはとても重要です。しかし、過去のデータにばかり囚われていると、正確な予測を行うことが難しくなります。
例えば造船の荷物運搬の予測を立てようとした場合、重要なデータとして「その年の休日数」・「景気や為替動向」・「天候や気候」などが挙げられます。しかし過去の年間運搬数量のデータといった典型的な過去のモデルに囚われていると、正確な将来の予測を立てることができないだけでなく、より重要なデータを取り入れることもできません。
既存のデータのみを使ったモデルでは以下のようなデータが予測対象に入らないために正確な予測モデルを構築することが困難になります。
- 一時的、断続的なデータ
- 特殊ケースのデータ
- 外部要因のデータ
- 前例のないデータ
実際のビジネスにおいて例外や稀なケース、一時的な要因などは多く見受けられます。そのためイレギュラーな要素を取り扱わないモデルで将来を予測するというのは、あまり現実的とは言えません。
Amazon Forecast は Amazon.com が10年間取り組んできた技術をサービスとしたものです。主な特徴は Deep Learning のモデルを使用したフルマネージドなサービスであり、搭載した複数の Deep Learning のアルゴリズムによって正確な予測ができる点にあります。
Amazon Forecastの主な特徴はこの5点です。
- 正確な予測性能
- 既存のデータモデルよりも50%以上正確な予測が可能です
- 自動化
- モデルの構築からアルゴリズムの選定、モデルの検証まで全て自動で行います
- プライバシーとセキュア
- データはとても厳重に管理され、顧客以外が触れることが無いようにしています
- カスタマイズ性
- 自前のアルゴリズムを用意することも、既存のアルゴリズムをカスタマイズすることも可能です
Overview
Amazon Forecastの仕組みはこのようになっています。
- Amazon S3バケットからデータを取り出します
- アルゴリズムを選択します(選択方法は任意でも自動でも可能です)
- 予測の正確さを検証した上でデプロイが行われます
- Amazon Forecastのコンソール画面より、データの予測を確認することが可能です
MLの専門知識やデータパイプラインについて未経験であっても、Amazon Forecastは問題なく利用できます。APIやコンソールを使ってMLを構築し、データパイプラインを設定することができます。検証に必要なデータは自動的に取り入れられ、モデルの検証や予測の管理も行い、より正確なアルゴリズムへと更新していきます。
Amazon Forecastでは、与えられたデータ対して適切なアルゴリズムを自動で選択する機能が搭載されています。また、Amazon ForecastにはAutoMLという機能がついており、データの設定からアルゴリズムの選別、そしてモデルの検証といった一連の流れを全て行ってくれます。データごとに適切なアルゴリズムを自動で選別して、検証をすることが可能です。
Amazon SageMaker から自作のアルゴリズムをAmazon Forecastにインポートすることができます。
Amazon SageMaker と Amazon Forecast は以下のような特徴があります。
-
Amazon SageMaker
- モデル検証のデータは事前に用意する必要がある
- アルゴリズムは事前に決めておく必要がある
- 予測モデルの改善は手動で行う必要がある
-
Amazon Forecast
- MLの専門知識は必要ない
- アルゴリズムは自動で選択される
- 予測モデルの改善は自動で最適な状態にされる
Summary
Amazon Forecast を最も有効に使うのであれば、最低でも1000以上のデータポイントと時系列データを用意する必要がありますが、少ないデータセットでも十分な成果を出すことはできます。ユースケースとしては、在庫の予測、ウェブの閲覧予測、経営の予測、需給予測などに適しています。
Amazon Forecastの特徴をまとめると、以下の4つとなります。
- Amazon.com で10年以上取り組んできた技術のサービス化
- 自動でモデルの再構築と検証、アルゴリズムの選定などの一連の流れを行う
- 予測に必要であれば外部からデータの追加も可能
- コンソールやAPI、CSVフォーマットで予測データを可視化可能
まとめ
Introduction to Amazon Forecast の動画紹介は以上となります。
世界最大のECサイトである Amazon.com が長年培ってきた技術のマネージドサービス化によりいかに「AI技術をど使うことでどこでビジネスを最大化できるか?」を考えていくことが求められる世界が来たように思えます。
現在はまだPreview申請の段階ですが利用可能になったタイミングでどんどん検証していきたいと思います!