はじめに
この度、ANGEL Calendarの企画に参加させていただいています!
様々な良記事が投稿されておりますので、是非こちらのリンクからご覧ください!
本記事では、私が普段の業務で触れているEAIツールとAWSをリンクしてみようと考えてみました。
拙文ですが、ご興味ある方はぜひお付き合いください。
EAIツールとは
EAIとはEnterprise Application Integrationの略で、企業内で使用される複数の異なるシステム間において、データや業務プロセスを効率よく統合するミドルウェアのことです。
今日、企業は様々なシステムを導入していますが、その多くは業務・部門ごとに開発されており、各システム上にデータが分散、サイロ化されています。
こういった状況下で、必要な情報を迅速に取得できるようにするため、EAIツールが役立ちます。
ETLとの違い
混同しやすい概念としてETLがあります。
AWS GlueなどのETLツールは、Extract・Transform・Loadの頭文字を取ったIT用語で、データの抽出・変換・書き出しを行うことによって、データを集約・統合することを目的としています。高度なデータ分析やデータマイニングが主な用途となります。
EAIツールは、データを単一のデータウェアハウス等に集約することを目的とはしていません。CRMやERPなどを使った業務システムやWebシステムといった、システム間の違いを吸収しながら、複数アプリケーションを通じてデータをやり取りするのが目的です。
EAIツールとAWSの組み合わせ
AWSサービスを組み合わせてEAIを実現することも可能ですが、必要なアダプタやEAIツールにパッケージングされた機能の過不足等を考慮し、比較・選定を行う必要があります。
AWSとの連携の強化を進めているEAIツールも多く、必ずしもツールの得意領域までをAWSに頼らなくてもよさそう。。。(認識違ったらごめんなさい!)
そこで、EAIツールを使用しつつ、AWSを組み合わせたサービスの形を考えてみました。
挙げればキリがないですが、3例ほどまとめてみます。
■ リアルタイムデータ統合プラットフォーム
- 1.データの収集
- ・EAIツールにより様々なデータソース(センサー、アプリケーション、データベースなど)からデータを収集
- ・これにより、異なる形式やプロトコルのデータを一元的に取り扱える
- 2.ストリーミング処理
- ・Kinesisを使用して、収集したデータをリアルタイムでストリーミング処理
- ・データのフィルタリング、変換、集約を行い、必要な情報を抽出
- 3.保存
- ・RedshiftやS3にデータを保存
- 4.可視化と分析
- ・QuickSightを使用し、データの可視化とダッシュボードの作成
- ・リアルタイムでデータの変化を監視し、ビジネスインサイトを得る
ユースケース
EAIツールがデータの収集や初期の変換、ルーティングを担当し、Kinesisはその後のリアルタイム処理を担当することで、各ツールの強みを活かせる。スマートシティ、金融、製造業など、リアルタイムの監視・分析、意思決定に活用できそう。
■ IoTデバイス管理とデータ分析プラットフォーム
- 1.IoTデバイスの管理
- ・AWS IoT CoreでさまざまなIoTデバイスを安全に接続・管理
- ・デバイスからのデータを収集
- 2.データの処理と連携
- ・EAIツールにより、収集したデータを異なるシステムやアプリケーションに連携
- ・データの変換、フィルタリング、ルーティングを行い、必要な場所にデータを提供
- 3.リアルタイムデータ処理
- ・Lambdaを使用して、リアルタイムでデータを処理
- ・イベント駆動型のアーキテクチャを採用し、データの変化に即対応
- 4.保存と分析
- ・S3等にデータを保存
- ・SageMakerを使用して、機械学習モデルを構築し、データ分析を行う
- ・QuickSightでデータの可視化を行い、インサイトを得る
ユースケース
こちらもEAIツールでデータ収集、AWSに保存・分析の形。スマートホームや産業用のIoT、医療やヘルスケアにも活用できそう。
■ カスタマーエクスペリエンス向上プラットフォーム
- 1.顧客データの統合
- ・EAIツールでさまざまなソース(CRMシステム、ウェブサイト、モバイルアプリなど)から顧客データを収集し、統合
- 2.パーソナライズされた推奨機能
- ・Amazon Personalizeで、顧客データに基づきパーソナライズされた情報提供
- ・過去の購入履歴や閲覧履歴に基づいて、顧客に最適な商品やサービスを推奨するなど
- 3.チャットボットによる顧客サポートの自動化
- ・Amazon Lex等を使用してチャットボットを構築
- ・よくある質問への対応や、簡単なトラブルシューティングなど
- QuickSightにサインアップ
- データセットの準備
- 分析
ユースケース
ECサイトや金融サービスなど、商品やサービスの推奨、自動サポートが求められる場面。
Amazon QuickSightを触ってみる
挙げてきたように、基本①EAIツールで複数のシステムからデータを統合し、②AWSに保存して分析や意思決定に寄与する、という形になりそうです。
役割上、BIツールであるAmazon Quicksightは特に相性が良いのですが、
私自身まだQuickSightを使ったことがないため、この機会に触ってみようと思います。
手順
シンプルな3段階です。
QuickSightにサインアップ
初めてQuickSightを使う場合、まず、コンソールからQuickSightにサインアップを行います。
その際に選択するQuickSightリージョンは、ユーザ情報を格納するディレクトリをどのリージョンに確保するかを指定するもので、ここで選択したリージョンに無料で使用できるSPICE領域が確保されます。
SPICE領域
QuickSightにはSPICEというインメモリ型の高速データベースが内蔵されており、SPICEの領域にデータを取り込んでおくことで、高速なBI応答が可能になる。(SPICEを用いずAthenaやRedshiftに直接クエリしても利用可能)
(Amazon QuickSight - Visualization Basics (Japanese) (workshops.aws) より引用)
データセットの準備
次に、分析に用いるデータを準備します。
今回はS3に格納されている2つのCSVファイルを用いるので、URLを用いてデータソースを指定します。
接続ができたら、以下のようにデータ編集画面に移ります。
ここでは、フィールド名を変更したり、複数のデータソースをジョインしたりと、利用しやすい形に修正できます。
下画像では顧客IDを基準にCSVをInner Joinしています。
今回はCSVファイル同士でしたが、異なるDB(PostgreSQLとMySQLなど)のテーブルとCSVをジョインすることも可能です。
保存して視覚化すると、分析画面に移行します。
分析
分析画面は左から3分割されています。
左(データ):フィールド一覧。ビジュアルで用いるものを選択する
真中(ビジュアル):グラフなどの形式を選択する
右(シート):グラフなどを作成し配置する場所
実際に1つグラフを作成してみます。
ビジュアルのパネルで用いたいグラフ(ここでは折れ線グラフ)を選択すると、フィールド定義設定画面が表示されます。
使いたいフィールドをドラッグ&ドロップし、シートの右に新たに表示されるプロパティから軸の単位や表示形式を少し修正すると、あっという間に下のようなグラフが作成できました。
ビジュアルの右上にある … からMLによる予測の追加も簡単にできます。
この予測に使うモデルはユーザ側では調整できませんが、別途提供されているAmazon SageMakerとの連携機能を利用すると、ユーザ独自に学習させたモデルを使った分析も可能だそうです。
同様に、KPIやワードクラウド、分類別グラフなど一つずつビジュアルを追加していきます。
体裁を整えて、以下のようなダッシュボードが作成できました。
使ってみて
QuickSightにより、直感的かつ簡単にダッシュボードを作成できました。
今回触れた部分はほんの入り口で、できることはまだまだ幅広いです。
先述のSageMakerとの連携や、異常検知の実装、コードでダッシュボードを作成するなど、時間を見つけてさらに深めていきたいと思います。
最後に
ここまでお付き合いいただきありがとうございました。
投稿を引き受けたものの、中々ネタが思いつかず実力不足を痛感していますが、とても良い刺激になりました。
これを機に勉強もアウトプットもがんばろ。
ちょっとしたことでもよいので、ご意見やご指摘等あればご教示ください!
冒頭の繰り返しになりますが、ANGEL Calendarでは毎日ブログが投稿されています。
興味深い記事ばかりですので、是非他の記事もご覧くださいね!