前書き
株式会社NTTデータ テクノロジーコンサルティング事業本部 デジタルテクノロジー&データマネジメントユニット 所属の Kento_Imamura です。
現在、ラスベガスで開催されているSnowflake Summit 2023に現地参加しています。Snowflake Summitは、Snowflake社が年次で開催する最大規模のカンファレンスです。今年のテーマは「The World’s Largest Data, Apps, and AI Conference」で、6月26日から6月29日までの4日間にわたって開催されており、400セッション以上、200以上のパートナー企業が参加しています。
本記事ではDay3に行われたBuilder Keynoteの内容をお届けします。
Builder Keynote
Builder Keynoteでは、Snowflakeの様々な最新・注目機能が寸劇形式で紹介されました。
1. オープニングスピーチ
まずは、Snowflake 創業者の1人であるBenoit Dageville氏の挨拶から始まりました。
Opening Keynoteでも言及があったSnowflake MarketplaceでのNative Apps公開など、Snowflakeエコシステムの未来について語られました。
また、Snowflakeでは、Snowflakeのユーザを「DataHero」とよび、その中のリーダが「DataSuperHero」として、Snowflake社から認定されています。本スピーチの中でもDataHeroやDataSuperHeroへの感謝が述べられ、最善席に並んだDataSuperHeroが紹介されました。
日本からは、NTTデータの渋谷亮太氏(写真一番右)をはじめ、6名のDataSuperHeroが今回のSummitに参加されていました。
2. 想定ユースケース紹介(寸劇)
Snowflakeのキーマンたちが「Tasty Bytes」という架空の会社の社員を演じながら、Snowflakeの最新機能を紹介していました。
コミュニティマネージャが司会を担当し、プロダクトやアーキテクト・データサイエンティストなどの各分野の責任者たちが演者として出演していました。キーマンたちが寸劇を通してユーザにわかりやすくその良さを伝えようとする、そんなSnowflakeの姿勢にも強く感銘を受けました。
出演者とその役割は以下の通りです。
- ナレータ
- ELSA MAYER (Snowflake, Senior Community Manager)
- 現場アナリスト
- FELIPE HOFFA(Snowflake, Lead Developer Architect)
- データサイエンティスト
- MARIE COOLSAET(Snowflake, Lead Data Scientist)
- テクニカルリード
- DASH DESAI(Snowflake, Lead Developer Ardvocate)
- プロダクトマネージャ
- AMANDA KELLY(Snowflake, Director of Product, Streamlit Co-founder)
寸劇のストーリー
「Tasty Bytes」のフランチャイズオーナーたちにデータドリブンな意思決定をしてもらうべく、上記のメンバで協力して開発を進めるというもの。収益最大化を目指す「Tasty Bytes」がSnowflakeの様々な機能を使って意思決定を支援していきます。
起こっている課題
「Tasty Bytes」では、下記のような課題があると設定されていました。いずれも、現場で起こり得る課題だと感じます。
課題①: Streamingデータの取り込みが難しい
データサイエンスチームがPoCで作成した需要予測モデルによって、利益リフトが期待できることがわかりました。一方で、その予測にはバッチデータとストリーミングデータの両方が必要で、その両方をうまく取り込む必要がありました。
課題②: 分析環境がサイロ化している
現場アナリストとデータサイエンスチームはそれぞれ異なる外部環境をつかっていて、サイロ化が生じています。 そのため、チーム間の連携も難しい状態です。
課題③: 分析結果利用までのリードタイムが長い
現場アナリストやデータサイエンスチームが分析したものを都度提供しているため、現場のフランチャイズオーナーのアクションに至るまでに時間を擁してしまいます。
課題に対処するための機能
課題①に対する機能:Snowpipe Streaming / Dynamic Tables
Opening Keynote でも紹介されたSnowpipe StreamingやDynamic Tablesを用いることで、取得されたデータを直接Snowflakeテーブルに書き込むことが可能。
無事、需要予測モデルに必要なストリーミングデータを取得できるようになりました。
課題②に対する機能:Snowpark Modeling API / Snowpark Container Services
こちらもOpening Keynoteで紹介されたSnowpark ML Modeling APIを用いることで、Snowparkでscikit-learnやxgboost、lightgbmなどのモデルの学習や特徴量エンジニアリングが可能に。
さらに、Snowpark Container Servicesにより、GPUでの学習やデプロイも可能に。
これによって、現場アナリストもデータサイエンスチームも外部環境が不要となり、Snowflakeで完結。脱サイロ化・スムーズな連携を実現できるようになりました。
また、外部環境にデータやモデルを持ち出すこともないため、ガバナンスも強化することができます。
課題③に対する機能:Streamlit in Snowflake
Streamlit in Snowflakeを用いることで、データアプリを迅速に作ることが可能に。
さらに、別セッションでも取り上げられていた、
st.experimental_data_editor()
を用いることで、アプリで表示したテーブルにユーザが書き込むことにより、アプリからデータを更新できるようになりました。
作成したアプリは簡単に他のSnowflakeユーザに共有することができます。
インタラクティブなアプリを迅速に提供することにより、現場のフランチャイズオーナーがスムーズに意思決定を行えるようになりました。
3. おわりに
実際の現場でも起こり得る課題に対して、注目度の高い機能を取り上げながら進めていく寸劇であり、非常に興味深い内容でした。
ページ下部にその他のKeynoteや個別セッションの記事のリンクもございますので、ぜひご覧ください。
Snowflake Summit 2023関連記事
Snowflake Summit 2023 現地レポート Day1 - Partner Summit -
Snowflake Summit 2023 現地レポート Day1 - Generative AI's Impact on Data Innovation in the Enterprise -
Snowflake Summit 2023 現地レポート Day2 - Snowflake Summit Opening Keynote -
Snowflake Summit 2023 現地レポート Day4 - Panel Discussion: Predictions on Generative AI and LLM in the Enterprise -
仲間募集
NTTデータ テクノロジーコンサルティング事業本部 では、以下の職種を募集しています。
- クラウド技術を活用したデータ分析プラットフォームの開発・構築(ITアーキテクト/クラウドエンジニア)
- データサイエンス領域(データサイエンティスト/データアナリスト)
3.お客様のAI活用の成功を推進するAIサクセスマネージャー
4.DX/デジタルサクセスを推進するデータサイエンティスト《管理職/管理職候補》