はじめに
2026年2月に開催されたイベントSAP Inside Track TOKYO 2026にて、「SAP Databricksを触ってわかったこと - TechEdハンズオン実践レポート」というテーマで登壇しました。
今回は、その発表内容をベースに、実際にSAP Databricksを触ってみて感じたことを整理してブログとしてまとめます。
*イベントレポはこちら
SAP Databricksとは何か
SAP Databricks は、2025年2月に正式発表された新しいサービスです。
大きな特徴は、Zero-copy と Delta Sharing にあります。従来のように ETL を利用して大量の SAP データを抽出し、SAP 外の DWH や分析基盤へ物理コピーする構成ではなく、SAP データをセマンティクス(業務的な意味)を保持したまま、他社ソリューションと共有するというコンセプトになっています。
実際、BDCはDatabricksだけではなく、Snowflake、Google Cloud、Microsoftなどとのパートナーシップも発表しています。すでに企業内で利用している Databricks や Snowflake、Google Cloud、Microsoft環境と連携を強化し、それぞれの強みを活かしながらSAP データの活用範囲を拡張する設計になっているように感じました。
今年に入ってからは、国内外で導入事例も少しずつ公開され始めており、発表フェーズから実運用フェーズへ移行しつつある印象を受けています。
個人的に、SAPデータ活用の領域で面白い発表だと感じており、今回ハンズオンにも参加し、実際に触ってみました。
今回実施したハンズオン
実施したハンズオンは大きく2つです。
①キャッシュフロー予測
まず1つ目のハンズオンは、過去の入出金実績や支払・回収パターンをもとに、将来6か月間のキャッシュイン/キャッシュアウトを予測するキャッシュフロー予測のシナリオです。
手順としては、
| Step | 内容 |
|---|---|
| ① | S/4HANAのキャッシュフローデータプロダクトを SAP Foundation Service上で有効化し、キャッシュフローデータをデータプロダクトとしてSAP Business Data Cloud上で管理できるようにします |
| ② | 有効化したデータを Zero-copy/Delta Sharing の仕組みを利用してSAP Databricksに共有し、SAP Databricks上で機械学習/AIモデルを用いたキャッシュフロー予測を実施します |
| ③ | 予測結果をカスタムデータプロダクトとして BDC Cockpitに公開します |
| 範囲外 | データプロダクトを DSP や SAC と連携し、分析や可視化します |
支払遅延予測
次のハンズオンは、過去の入金履歴や顧客属性、取引条件などのデータをもとに、「将来どの取引で支払遅延が発生する可能性が高いか」を予測する支払遅延予測のシナリオです。今回は、単純なAI予測だけではなく、「なぜ遅延リスクが高いのか」という根本原因を分析し、その内容を自然言語で説明するところまで含まれたハンズオンになっていました。
手順としては、
| Step | 内容 |
|---|---|
| ① | SAP Foundation Service上で対象データを有効化し、BDC Cockpit上でデータプロダクトとして管理可能な状態にします |
| ②-A | データプロダクト内の Entry View Journal Entry データを SAP Databricks に共有し、機械学習モデルを用いて将来の支払遅延リスクを予測します |
| ②-B | どの要素が遅延リスクに影響を与えているのかを分析し、主要因(ドライバー)を特定します |
| ③ | SAP AI Foundation の LLM サービスを統合し、予測結果やドライバー情報を自然言語テキストへ変換します |
| ④ | 予測結果と説明インサイトをデータプロダクトとしてBDC Cockpitに公開し、他システムや分析ツールから活用できる形にする流れとなっています |
実際に触ってみてどうだったか
実際に触ってみると、ハンズオンを最後まで完了するまでに2日ほどかかりました。環境が年末まで開放されていたため、自分のペースで試行錯誤しながら進めることができましたが、イベント本番の3時間枠の中で完走するのは、少なくとも自分にはかなり難しいボリュームだでした。
特に今回は、Databricksを初めて触る状態からのスタートだったこともあり、Notebookの構成や ML系ライブラリ、各種設定などに慣れるまでに時間がかかりました。また、途中でエラーが発生する場面もありましたが、個人のAIやDatabricks内のAIを活用しながら修正し、なんとか最後まで進めることができました。Databricks を活用していく上では、これまで SAP のデータ関連領域を中心に扱ってきたエンジニアにとっても、新しいスキルセットが必要になる印象を受けました。特に、Python や機械学習、Notebook ベースでの開発、ML モデルの考え方などは、従来の SAP BW や Datasphere 中心の世界観とは少し異なるため、今後キャッチアップしていく必要がありそうです。
一方で、ハンズオン自体は単純にコードを実行するだけではなく、スクリプトの中にグラフや可視化シナリオも組み込まれていたため、一つ一つのステップがが理解しやすい構成になっていました。また、単なるMLモデル作成で終わるのではなく、SAPデータプロダクトをDatabricksへ共有し、予測結果を再びBDCに戻すところまでを一連の流れとして体験できた点も印象的でした。これまでのSAPデータ活用では、BIやレポーティングが中心という印象が強かったため、SAPデータとAI・機械学習が連携が進んでいるなと感じました。
また、どのようなことが実現できるのかについては、SAP Business Accelerator HubでもシナリオやAPIが公開されており、実際のユースケースを確認できるようになっています。
感想・課題まとめ
今回 SAP Databricksのハンズオンを通して、SAPデータ活用の幅がかなり広がる可能性を感じました。
まず良かったところは予測分析や機械学習といった領域が、SAPデータ活用の中に組み込まれ始めている点です。これまでのSAPデータ活用はBIやプランニングのイメージが強かったですが、Databricksと連携することで、よりMLのような高度な分析が現実的になってきているように感じました。
また、Zero-copyやDelta Sharingによって、SAPデータを効率的に共有できる点も大きなメリットだと思います。従来のように大量データをETLで抽出する必要がなくなり、SAPデータをセマンティクス付きのまま活用できるのはかなり面白いポイントでした。
一方で、SAP DatabricksはAutoMLの機能を持っているものの、ノーコード製品ではありません。実際に触ってみると、Pythonや機械学習、Databricks特有の知識など、これまでSAPのデータ周辺を扱ってきただけでは対応しづらい場面もあり、新しいスキルセットが必要になる印象を受けました。ですが、既にDatabricks活用して機械学習基盤を持っている企業にとっては、SAPデータを扱いやすくなるという意味で、かなりフィットしやすいソリューションだと感じました。
今後、SAPデータをAIや予測分析に活用したい企業にとって、SAP Databricksはかなり可能性のある選択肢になっていきそうです。今後も実際に触りながら、どのようなユースケースにフィットするのかを継続して検証していきたいと思います。