#はじめに#
現在、CloudのDatastoreもあるし、オンプレミスのデータベース、Data martやData warehouse、SaaSなどの製品も乱立し、多くの企業でデータを分散して保持せざるをえない状況となってきている。いわゆるサイロ化された状態である。分散したデータを集めるためには、システム間のIFプログラムを作成したり、ETLツールを駆使して、データ収集が必要である。これらは工数も期間もかかるし、セキュリティやネットワーク速度など考えなくてはいけないことが盛りだくさんである。SAPもこれまでにSAP Data Hubをリリースし、これらの解決をめざしてきたが、今回はその後継になるSAP Data Intelligenceの紹介のセッションが複数組まれていたので、オンタイムでの参加は難しかったが後日、録画のセッションを確認してみた。
メイントラック:INTEGRATED INTELLIGENT SUITE
サブトラック:Integrate data
#講義内容#
##Introduction to SAP Data Intelligence[DAT111]##
SAP Data Intelligenceでは、自動的に意味のあるデータに変換し、ビジネス的に価値のあるデータにすることを目的にしている。
※SAP TechEd2020 - Introduction to SAP Data Intelligenceから引用
SAP TechEd2020ホームページ (https://pages.sapteched.com/sap/sapteched2020/index)
主な機能として、Active metadata management and governanceがある。収集したMetadataを自動的に分析し、Metadataのカタログを作成することができる。カタログを作成することで、ユーザはあらゆるデータソースの情報を一元的にみることができる。
※Metadataとは:データのデータと呼ばれるもの。例えば、写真データだと、データ本体は写真の画像そのもの、メタデータは、撮影日付、データ容量、撮影場所の座標情報、撮影機器など。
※SAP TechEd2020 - Introduction to SAP Data Intelligenceから引用
SAP TechEd2020ホームページ (https://pages.sapteched.com/sap/sapteched2020/index)
また上図のようにWorkFlowを作成し、データを収集することができる。BWのプロセスチェーンやData Servicesからリモートでジョブをスケジュール実行してインタフェースすることができる。見る限りはコーディングも不要だし、慣れれば短時間での実装も可能かもしれない。
SAPからはPO/PIなどインタフェース関連の製品が幾つかでてるし、他社製品もでてるので、本当に何が使い勝手が良いのかは将来性も含め、比較検討が必要であると思う。
##SAP Data Intelligence Data Integration with Enterprise Applications [DAT204]##
SAP Data Intelligenceは、S/4HANAやBW/4HANAやSAPが提供しているSaaSシステム(Ariba,Concurなど)やNon-SAP ApplicationやSAP Cloud Platformと容易に接続できるPipelineやConnectorを準備している。
※SAP TechEd2020 - SAP Data Intelligence Data Integration with Enterprise Applicationsから引用
SAP TechEd2020ホームページ (https://pages.sapteched.com/sap/sapteched2020/index)
SAP Data Intelligence側のCDS Readerの操作により、ABAP側のCDS ViewをReplication(Initial,delta)することができる。
あらかじめ準備した機能を利用することで、コーディングなしでデータを同期することができる。
※SAP TechEd2020 - SAP Data Intelligence Data Integration with Enterprise Applicationsから引用
SAP TechEd2020ホームページ (https://pages.sapteched.com/sap/sapteched2020/index)
Non-SAP Application(例えば、Amazon S3,Microsoft Azure Data Lake, Google Cloud Storage)とも標準でConnectorが準備されており、利用することができる。FTPでシェルを作成したり、中継でIF基盤を利用する必要はなさそうである。
SAP Cloud Platformを連携することで150以上ものSaaS製品とシームレスに連携することができる。
※SAP TechEd2020 - SAP Data Intelligence Data Integration with Enterprise Applicationsから引用
SAP TechEd2020ホームページ (https://pages.sapteched.com/sap/sapteched2020/index)
#おわりに#
これまで以上にあらゆるデータソースから、容易に短時間でデータ収集する仕組みはできてきており、またそのデータを機械学習で整理することができるような基盤ができあがりつつあると感じた。今後は、その収集したデータに対してどのように意味をもたせクライアントのビジネスに生かすことができるのかを考えるのがコンサルとしては大事であると思う。これらはデータサイエンティストの領域になるかもしれないが、今後、事例が出てくると思うので、どのようなビジネスインパクトがあったのかは注視していきたい。