5
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【イベントレポート】Snowflake WTTokyoに参加してみて見えてきた最近のデータ分析基盤構築および活用の状況

Posted at

はじめに

Snowflake World Tour Tokyo Day1, Day2に参加しました。
Keynoteセッションおよび複数の企業事例セッションに参加し、Snowflakeの最新技術動向や各社のデータ活用の取り組みについて学びました。
本レポートでは、Snowflakeが提供する機能の方向性や、企業事例から得られる実践的な知見を整理します。

記載すること / 記載しないこと

  • 記載すること

    • Snowflakeが提示する技術動向(AIL機能拡張、データ共有、外部データ活用など)
    • 各社のデータ分析基盤構築 - 運用の工夫と課題
    • 参加セッションで得た学び
  • 記載しないこと

    • セッションスライドの詳細な転載(公開されていない情報)
    • Snowflakeの細かな技術仕様

対象者

  • データ分析基盤構築 - 運用に関わるエンジニア
  • データ利活用を推進する企画 - マネジメント層

記事構成

  1. Snowflakeの技術動向と各社取組状況総括
  2. 参加セッションのレポート

1. Snowflakeの技術動向と各社取組状況総括

以下は2. 参加セッションのレポートの総括になります。
各セッションについて知りたい方は2. 参加セッションのレポートをご覧ください。

概要

  • Snowflake社はデータ活用を促進のためAI関連の機能を強化している。
  • 各社もデータ分析基盤の構築については一定の成果が出ているまたはゴールが見えてきている状況。
  • 一方データ活用についてはAIを利用した取り組みも含め模索中。

詳細

  • Snowflake社はデータ分析基盤の構築のための技術提供から、構築した基盤を活かすための技術提供フェーズに入っている印象。
  • AI関連機能のアップデートに注力しており、基本的なタスクを実行するためのAISQLをはじめとした Cortex AI 機能や、エージェント機能である Snowflake Intelligence が紹介されていた。
  • AIをより良く活用するには品質の高いデータが必要との考えから、基盤構築のためのサービスのアップデートにも引き続き力を入れている。
  • Marketplace を利用した外部データ連携、Openflow Connector によるデータ取り込みのための接続、Gne2ウェアハウス などコンピュートリソース等のサービスの展開、アップデートがされている。
  • 各社の取組状況としてはSnowflake上でデータ分析基盤を構築することで、オンプレでの課題(高コスト - リソース不足等)を解決。リソース調整やコスト最適化も進展。
  • データ活用については進捗が企業ごとに異なり、どの企業もまだ模索中。
  • データをどう活用したいかは現場が詳しいため、各社現場に近い人材がデータ活用に参画できるための環境づくりを進めている。
  • 機能面ではStreamlitCortex AI関連を利用し非エンジニアがデータにアクセスしやすくしデータ分析を簡単にできるような仕組みづくりを実施または検討中。
  • 機能面のみならず教育についても実施が必要という認識でいる。
  • 個々の教育はもちろんだが、AIを利用してビジネスを進めるための組織作り(AI-Ready)も実施が必要。
  • AIについては、AIに対する「なんでもできるエージェント」のような過度な期待は落ち着き、どこまで実施可能かを模索中。
  • エージェントについても上記の通り1個でなんでも解決というより、まずあくまでユーザーのサポートととして専門的なエージェント(xxエージェントのような形)の作成から着手。

2. 参加セッションのレポート

以下は参加セッション情報となります。
各セッションの情報と学び - 気づきを簡単に記載してます。

セッションタイトル:Snowflake Cortex AISQL を用いた高度な分析手法

  • 登壇者:菅野 翼(Snowflake)

  • セッション概要(Snowflake社紹介のまま):
    新機能であるCortex AISQLは、SQLにAI機能を直接組み込むことで、テキストだけではないマルチモーダルデータを高度に分析できる新しい仕組みです。
    Cortex AISQLを用いることで、より短いステップで、より高度な分析を行うことができるため、ビジネスの速度に追随してデータから価値を創出することが可能になります。
    本セッションでは、Cortex AISQLの各機能の概要と分析における応用例をご紹介します.

  • 学び - 気づき:

    • これからはAIドリブンなデータ活用文化が必要になる
    • Snowflakeは構造化、非構造化データ両方格納可能であり、Cortex AISQLを用いるとそれらデータの分析が容易になる
    • AISQLはSQL上でシームレスに利用可能な機能であり、AIの知識やモデルの用意が不要で誰でも簡単に利用可能

セッションタイトル:Day1 Keynote(AIとデータの価値)

  • 登壇者:スリダール - ラマスワミ(Snowflake CEO), 加藤恭子(ANA), 松永久(dentsu Japan), 長﨑忠雄(OpenAI Japan)

  • セッション概要(Snowflake社紹介のまま):
    Day 1 Keynoteでは、ビジネスにおけるAIとデータの価値をテーマにお届けします。Snowflake Inc. のCEOスリダール - ラマスワミが登壇し、AIとデータを安全かつ信頼性の高い形で、外部データと連携させて活用することで、企業がどのような具体的な価値を得られるのかを、事例を交えて紹介します。パネルでは顧客事例や日本における生成AIの最新動向について議論されました。

  • 学び - 気づき:

    • Snowflakeはこれまでもデータ分析基盤としてデータの格納 - 活用を支援してきた
    • 今後はAI DATA CLOUDとして「EASY / CONNECTED / TRUSTED」の三要素を拡張し続ける方針
    • マーケットプレイスやメタデータ拡張、Gen2ウェアハウスなどの進化により「何ができるか(用途)」にフォーカスした機能拡張が行われている

セッションタイトル:Snowflake × Streamlitで拓く、次世代データアプリケーション最前線

  • 登壇者:寺尾 史仁(インテージ), 堀 幸太(インテージテクノスフィア)

  • セッション概要(Snowflake社紹介のまま):
    「自社データだけでは見えてこない、新たなインサイトが欲しい」というニーズに応えるため、インテージがStreamlit in Snowflakeによるインタラクティブなデモを交え、高品質な市場データを用いた次世代データアプリケーション事例を紹介しました。

  • 学び - 気づき:

    • 内部データ統合だけでなく外部データの利用が重要だが、従来はツールの分断でコストが増大していた
    • Snowflake上で取り込み - 格納 - 外部連携 - 分析 - 共有まで一貫して実施できれば工数削減と迅速な価値提供が可能
    • Snowpark Container Services と Streamlit in Snowflake を組み合わせ、今後はAI機能による深堀りを模索中

セッションタイトル:クラウドシフトはゴールではない、事例に学ぶデータの民主化と内製化のリアル

  • 登壇者:宮永 浩次(カプコン), 林 勇磨(日立ソリューションズ)

  • セッション概要(Snowflake社紹介のまま):
    全従業員がデータを利活用できるデータドリブン組織へ変革するための「データの民主化」「内製化」に関する取り組みを事例とともに紹介。基盤導入後の組織運営や次のアクションに繋げる重要性を解説しました。

  • 学び - 気づき:

    • オンプレの限界(コスト、リソース、運用)を受け、Snowflakeへ移行することで解決した事例
    • データマートの作成までのリードタイムやリカバリ時間の短縮など運用効率向上の効果が得られている
    • 基盤構築は出発点であり、最終的には社外データ活用や現場主導による自走化がゴール

セッションタイトル:GLOBAL WORKなど40以上のマルチブランド×1,600店舗を動かす、次世代データエコシステムの舞台裏

  • 登壇者:甲斐 裕樹(アンドエスティHD)

  • セッション概要(Snowflake社紹介のまま):
    ライフスタイル - ファッション領域を中心に多数ブランドを展開する同社が、Snowflakeで全社データ基盤を刷新し、リアルとオンラインを横断するデータエコシステムを構築する事例を紹介しました。

  • 学び - 気づき:

    • 社内外で散在している分析のためのデータを一つに統合するためSnowflakeを利用
    • Snowflakeを利用することによりストレージとコンピュートリソースの分離、柔軟なスケーラビリティ、フロー管理不要なデータパイプライン構築、データ共有の容易さの利点を得ている
    • 今後は職種別のAIエージェント(現場サポート/分析エージェント等)を作成して現場の生産性向上を図る予定

セッションタイトル:生成 AI データ基盤の実践ガイド

  • 登壇者:吉田 成利(AWSジャパン)

  • セッション概要(Snowflake社紹介のまま):
    Snowflakeへのデータ統合から、Amazon Q と Snowflake Cortex による自然言語でのデータ分析、Amazon QuickSight によるダッシュボード自動生成までを含む、実践的な統合データ基盤と生成AIの活用例を紹介しました。

  • 学び - 気づき:

    • データを蓄積する人と活用する人の境界が薄れ、ツール間連携(SageMaker, Qシリーズ, Snowflake)で蓄積〜活用をシームレスに進められる
    • Amazon Q と Cortex の連携により、自然言語での分析→ダッシュボード自動化が実現可能

セッションタイトル:Snowflake MLを活用したエンドツーエンドのMLワークロード

  • 登壇者:河上 伸一(Snowflake)

  • セッション概要(Snowflake社紹介のまま):
    Snowflake ML による、データ移動なしでのモデル開発と展開の方法、マルチGPUサポート、MLOps統合、Model Registry/Model Serving の活用、Container Runtime を用いたスケーラブルなトレーニング環境について解説しました。

  • 学び - 気づき:

    • 従来分散していたMLツール群をSnowflake上で完結できるようになり、特徴量管理やモデルリネージの可視化が可能になった
    • コンテナベースのランタイムでトレーニング/推論を行い、モデル管理 - デプロイの一連の流れが整備されつつある

セッションタイトル:クエリパフォーマンスチューニングの傾向と対策

  • 登壇者:Yoshi Matsuzaki(Snowflake)

  • セッション概要(Snowflake社紹介のまま):
    クエリパフォーマンス低下がユーザ体験と利用コストに与える影響を踏まえ、典型的な性能劣化パターンとその解決策、プロダクト内部の実装観点からの対処法を紹介しました。

  • 学び - 気づき:

    • パフォーマンス改善には目標設定と繰り返し(try & error)の姿勢が重要
    • 目標設定がないとどこで打ち切るが決まらず、姿勢がないと施策を建てても実行できない
    • 暫定対応で終わらせず恒久対応を目指すこと、Snowflakeの製品自体も日々アップデートしているのでSFサポートへ問い合わせることも重要

セッションタイトル:Snowflake MLの最新情報とMLOpsの効率的な運用ガイド

  • 登壇者:高田 雅人(Snowflake)

  • セッション概要(Snowflake社紹介のまま):
    ここ数年でSnowflakeの機械学習系の機能は大幅に拡充しております。本セッションではSnowflakeにおけるML関連の既存機能の特徴、新機能、既存パイプラインからの移行方法、MLOpsにおける効率的な運用方法について紹介されました。

  • 学び - 気づき:

    • SnowflakeでML開発Opsを実施するとコスト、スケーラビリティ、信頼性、柔軟性で大きなメリットがある
    • Notebookではコンテナを利用することでGPU推論やリアルタイム処理、データコネクタ経由の効率的ロード等が可能
    • モデルレジストリを活用することで学習データのリネージ管理や説明性の担保につながる

セッションタイトル:Day2 Keynote(データからAIまでを統合する最新情報)

  • 登壇者:クリスチャン - クライナマン(Snowflake VP), 佐藤 隆明(NTTドコモ CTO)

  • セッション概要(Snowflake社紹介のまま):
    SnowflakeのAI Data Cloud戦略を中心に、データからAIまで統合する技術の進化が紹介されました。デモでは自然言語によるAIエージェントを用いたデータ分析や可視化が披露され、NTTドコモからは自社におけるデータとAIの取り組みが共有されました。

  • 学び - 気づき:

    • OPENFLOWによる柔軟なデータ連携、セマンティックビューによる発見性向上、マーケットプレイスの拡張などデータ利用機能を強化
    • AI機能はCortexを強化し、Snowflake Intelligenceとしてエージェント機能を提供
    • 各社がSnowflakeに基盤を一本化し、現場人材によるStreamlit活用やリアルタイム分析を模索している

セッションタイトル:Snowflake Cortexで実現する 高度な分析環境の構築とその先のDX戦略

  • 登壇者:青山 恭隼(栗田工業)

  • セッション概要(Snowflake社紹介のまま):
    データ民主化が進む一方で、分析人材不足やスキル課題が残る中、Snowflake Cortexを活用して自然言語分析、内製化、SAP連携による経営データ分析高度化のソリューションが紹介されました。

  • 学び - 気づき:

    • データ活用においてシステム側ではコスト、スケーラビリティ、運用管理等が課題となり、またデータを活用したいのは現場側となるが活用方法や活用するための組織作りができていない
    • Streamlit、Cortex Analystを利用すると現場側で対話型な分析ができるインターフェイスを提供することが可能

セッションタイトル:AI-Readyデータのための実践的ロードマップ

  • 登壇者:庵原 崚生(primeNumber)

  • セッション概要(Snowflake社紹介のまま):
    生成AIを現場で活かすためには「AI-Ready」な基盤構築が不可欠。データ収集 - 統合 - ガバナンス - スキル教育を含むアーキテクチャ設計や、Reverse ETLやエージェント利用を見据えたロードマップが紹介されました。

  • 学び - 気づき:

    • AIを活用しようとしてもPoCで止まってしまうのはAI-Readyな組織作りができていないから
    • AI-Readyには「データ整備」と「データ活用」の2段階が必須
    • データの整備ではデータ統合やパイプライン構築品質担保が必要
    • データ活用ではメタデータ付与により発見性の向上AIを利用するためのスキル教育、活用のサイクルの促進等が必要

セッションタイトル:データドリブン創薬加速を目指した データ統合・解析基盤

  • 登壇者:武藤 裕紀(中外製薬)

  • セッション概要(Snowflake社紹介のまま):
    Snowflakeを中核に構築した研究データ基盤「dPROACT」の紹介。FAIR原則に基づくデータ統合 - 解析環境を整備し、創薬研究のDX推進を目指す取り組みが共有されました。

  • 学び - 気づき:

    • データ基盤×各種専門性がデータ活用につながる
    • Snowflake基盤により社内外データを統合し活用可能に
    • 現場が自前で分析可能になるようPythonやStreamlitの教育を推進
    • Cortex AIを利用し自然言語による分析の促進を予定

セッションタイトル:Snowflake Intelligence × Document AIで“使いにくいデータ”を“使えるデータ”に

  • 登壇者:大野 巧作, 向山 拓実(ナウキャスト)

  • セッション概要(Snowflake社紹介のまま):
    財務データのような非構造データ活用に向け、Document AIによるPDF抽出、Streamlitを用いたHuman-in-the-loop修正、Cortex Searchによる検索を組み合わせた実践事例を紹介。構造化/非構造化データ横断のSnowflake Intelligence活用が示されました。

  • 学び - 気づき:

    • Snowflakeの機能を利用し社内外のデータを統合し構造化・非構造化両データに対する問い合わせを容易にする環境を提供する
    • AI_EXTRACT、Streamlitとその結果を人が修正することにより非構造化データを構造化データとして格納
    • セマンティックビューの整備によるCortex AIの利用、Cortex Searchを利用した非構造化データの活用、そしてそれらを統合し利用するSnowflake Intelligenceを用いてデータ活用を促進

セッションタイトル:小売 - 食品業界におけるデータドリブン経営

  • 登壇者:井川 裕貴(日本アクセス), 小郷 和希 - 植田 歩瞳(日清食品HD)

  • セッション概要(Snowflake社紹介のまま):
    日本アクセスと日清食品HDのSnowflake活用事例。顧客中心施策の実現や対話型アプリ導入、組織育成を通じて小売 - 食品業界でのデータドリブン経営の実践が紹介されました。

  • 学び - 気づき:

    • 単にデータを蓄積するだけではデータ活用には至らない
    • またデータも完璧な状態で格納されるとは限らない
    • StreamlitやCOrtexを利用し現場がデータ活用を実施するためのハードルを下げるような促進が必要

まとめ

各社データ分析基盤構築は一定の成果が出ている印象でした。
データ活用の観点ではまだこれから取り組んでいくべき課題が存在しそれに挑戦している段階でした。
データ活用についてはやはり現場の目線が重要となるので、AI関連をはじめとしたSnowflakeの機能を利用して分析に取り組むためのハードルを下げたり、社内教育や組織文化づくり実施の必要性に迫られている企業が多かった印象です。
AI関連については上記の通り各社取り組み始めている段階でした。
ただ、今後は業務すべてがAIに代替されるかは不明ですが、AIを全く利用しない業務は無くなると思います。
従って、今後データ分析基盤構築の際は構築しつつ、ある程度構築が進んだ段階でAI関連の利用も並行して実施していくといった対応が求められるかもしれません。

5
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?