はじめに
IT初心者がdatabricksについて学んでいく上で
趣味のサッカーに関する記事を見つけたので
それを翻訳しつつ実際に使われていたサービスについて
同じIT初心者向けに紹介出来ればと思いました。
記事に出てくる用語についてまずは解説したいと思います!
Databricksとは?
Databricksは、エンタープライズ レベルのデータ分析を構築、デプロイ、共有、保守するための統合されたオープン・アナリティクス・プラットフォーム。
中でも大規模な AI ソリューション Databricks Data Intelligence Platform は、クラウドアカウントのクラウドストレージとセキュリティと統合し、クラウドインフラストラクチャを管理およびデプロイする。
対応しているクラウドサービス
- Microsoft Azure(アジュール)
- Amazon Web Services(AWS)
- Google Cloud Platform(GCP)
出来ること
- データの集約:いろいろな場所にあるデータを一か所にまとめて管理できる
- データの分析:SQLやPythonなどでデータを分析できる
- AI活用:機械学習や生成AI(LLMなど)を使った高度な分析や予測ができる
- クラウドで提供:インターネット経由してどこからでも使える
- データガバナンスやセキュリティ:データの管理やアクセス制御も簡単
DBRX Instructとは?
Databricks社が開発した大規模言語モデル(LLM)の1つ。
特徴:
-
Mixture of Experts(MoE)アーキテクチャ
たくさんの「専門家(エキスパート)」モデルが協力して答えを出す仕組みです。
これにより、効率よく高品質な回答ができます。 -
オープンソース
DBRX Instructはオープンソースとして公開されており、誰でも利用・カスタマイズが可能です。 -
高い性能
一般的な質問応答や文章生成、要約、翻訳など、さまざまなタスクで高い精度を発揮します。
ベンチマーク(MMLUなど)でも良い成績を出しています。 -
DatabricksのFoundation Model APIで利用可能
Databricksのクラウドサービス上で、API経由で簡単に使うことができます。
モデルの運用や管理を自分でしなくても、すぐにAI機能を組み込めます。
強み:
-
Databricksのクラウドサービスで簡単に利用可能
DatabricksのFoundation Model APIからすぐに使えるので、インフラ構築や運用の手間がかかりません。
セキュリティやガバナンスもDatabricksの仕組みで担保されます。 -
柔軟な拡張性・連携性
Databricksの他のAI・データサービス(RAG、Mosaic AI、Unity Catalogなど)とシームレスに連携できます。
企業のデータ活用やAI活用の基盤として最適です。 -
高い応答品質と多なタスク対応力
質問応答、要約、翻訳、文章生成など、幅広い用途に高精度で対応できます。
「Instruct」タイプなので、ユーザーの指示や質問に沿った自然な回答が得意です。
MLSのサラリーキャップとは
記事の概要、翻訳の前に、IT用語とは別ですが、MLS(メジャーリーグサッカー)のサラリーキャップ制度について知っていただければと思います。
MLS(メジャーリーグサッカー)のサラリーキャップ制度は、リーグ全体の競争バランスを保つために導入されている給与制限の仕組みです。アメリカの他のプロスポーツリーグ(NBAやNFLなど)と同様に、各クラブが選手に支払う年俸総額に上限を設けることで、資金力のあるクラブだけが有力選手を集めて独占的に強くなることを防いでいます。(GPT-4.1より)
記事概要:
近年、目覚ましい発展を遂げているメジャーリーグサッカーですが、他のNFLやNBA同様にサラリーキャップ制度が導入されています。手作業での確認では、毎年ルールに変更が発生するため、各チーム選手登録や強化のオペレーションの遅延に繋がっています。その問題の解決のため、Philadelphia Union社はDatabricksのサービスを使い、その規定を読み込ませたチャットボットを導入。
このチャットボットは、ChatGPTのような使いやすいUIで、複雑なルールや規定を即座に解釈・回答してくれる。
これにより、運営側は戦略的な業務に集中でき、ルール違反のリスクも減り、オペレーションが大幅に効率化された。
以下記事要約:
Philadelphia Union: Streamlining MLS Roster Planning with GenAIを翻訳させて頂きました。
要約:
Philadelphia Union社のチームは、Databricks社のData Intelligence Platformを活用し、MLSの選手登録管理を簡素化するGenAIチャットボットを導入しました。この使いやすいツールは、ChatGPTのようなインターフェースを通じて、複雑な選手登録規則や給与規定のナビゲーションを支援し、迅速な意思決定を可能にします。チャットボットは選手登録の規則の即時で情報を提供し、フロントオフィスがMLSのガイドラインを遵守しながら戦略的な業務に集中できるようします。この革新的なソリューションにより、業務が効率化され、チーム編成管理の生産性が向上します。
メジャーリーグサッカー(MLS)で競争力を維持するためには、戦略的な選手登録のプランニングと、移籍市場を賢く効果的に活用して強力なチームを構築・維持ことが求められます。そのため、MLSのチームは選手登録の構成規則や規定に依拠しています。しかし、これらの規則はしばしば膨大で法的な細部にまで及ぶため、意思決定のプロセスが遅れることがあります。この課題を認識したPhiladelphia Union社(2020年MLSサポーターズシールド受賞チーム)は、意思決定を効率化するためにDatabricks社のData Intelligence Platformを導入しました。高度なデータおよびAI機能を活用し、選手登録の構成やサラリーバジェットのガイドライン、その他複雑な規定に関するフロントオフィスからの問い合わせに対応するGenAIチャットボットを実装することで、業務効率と運用の明確性を向上させました。
Databricks社を活用することで、私たちは選手登録管理へのアプローチを変革し、複雑で時間のかかるプロセスを、効率的でデータ駆動型の業務へと転換しています。
Addison Hunsicker氏(Philadelphia Union社 サッカーアナリティクス シニアマネージャー)
このチャットボットは、Databricks社のAppsを通じて展開されるノーコードかつChatGPTのようなインターフェースから利用できます。Databricks Appsは、安全なデータおよびAIアプリケーションを迅速に構築するためのソリューションです。フロントオフィスは、チャットボットの会話形式のスタイルによって、簡単にアクセスできるだけでなく、選手登録規則の情報を数秒で得ることができます。これにより意思決定が加速し、貴重な時間を節約できるため、フロントオフィスはより戦略的で付加価値の高い業務に集中することが可能となります。
ソリューションアーキテクチャ:迅速な規則解釈のためのRAG(検索拡張生成)
このソリューションは、Retrieval-Augmented Generation(RAG:検索拡張生成)アーキテクチャの上に構築されており、すべてのコンポーネントがDatabricks社のData Intelligence Platformって完全に稼働しています。RAGは、「外部」のストレージ機構から関連するコンテキストを検索し、それをユーザーのクエリプロンプトに付加することで、大規模言語モデルから非常に正確かつ文脈に即した応答を生成します。
この場合、ストレージ機構として使用されているのは、Databricks社が提供するベクトル検索(Vector Search)というベクトルデータベースです。新しいPDFが自動的に利用可能となるよう、選手登録規則のPDFをDatabricks社のVolumes(Databricks上で半構造化データや非構造化データを完全にガバナンス管理できるストア)に継続的に取り込む仕組みが構築されています。その後、テキストが抽出され、Databricks社のFoundation Model APIのEmbedding Modelsを用いて数値表現(エンベディング)が生成されます。これらのエンベディングはベクトル検索によってインデックス化・提供され、迅速かつ効率的な検索・取得が可能となり、関連情報への素早いアクセスを実現しています。
Philadelphia Union社は、Databricks社独自のDBRX Instructモデルも活用しました。これは、Mixture of Experts(MoE)アーキテクチャに基づく強力なオープンソースの大規模言語モデル(LLM)です。DBRX Instructは、MMLUなどのベンチマークで優れたパフォーマンスを発揮します。さらに、このモデルはDatabricks社のFoundation Model APIを通じても利用可能であり、自社でモデルインフラをホストしたり管理したりする必要がありません。
彼らのRAGチャットボットは、Mosaic AI Agent Frameworkを用いてデプロイされています。これにより、RAGアプリケーションの各コンポーネントをシームレスに連携させ、Databricks社のModel Servingエンドポイント上でAPIとしてホストすることが可能になります。このフレームワークには、レビューアプリや組み込みの評価機能も含まれており、デプロイ前に人間によるフィードバックの収集やRAGソリューションの有効性検証に非常に役立ちました。これにより、チャットボットはフロントオフィスで利用可能になる前に、信頼性と最適化が確保されました。
ここからは、標準的なDatabricks社のAppsチャットUIテンプレートをMosaic AI Agent Frameworkのエージェントに接続するだけで、数分以内にチャットボットをデプロイすることができます。
まとめ
Databricks社は、Philadelphia Union社にとって「12人目の選手」となり、同クラブが先進的でデータ主導な組織へと変革するのを支援しています。スポーツ業界が進化を続ける中、Philadelphia Union社による高度なアナリティクスとAIの導入は、データインテリジェンスがピッチ内外の両方でゲームチェンジャーとなり得ることを示しています。
Union社による革新的なテクノロジーの活用は、MLSの選手登録規則への確実な対応を実現するだけでなく、選手獲得や育成においてもチームに競争優位性をもたらしています。Databricks社を活用することで、Union社はMLSの複雑な規則を的確に乗り越えつつ、最も重要な「勝るチーム作り」に集中できる体制を整えています。GG!
自分なりのまとめや感想
MLSの選手登録制度(サラリーキャップ制度)は非常に複雑で、毎年ルールが変更されるため、その都度内容を確認し、制度に抵触しないよう注意しながら、各クラブは優れた選手を集めて強いチームを作る必要があります。
公式にもSalary Guideとあり、常にファンも確認出来るようになっています。
今回のDatabricksを活用したユースケースでは、こうした複雑な制度の読解をAIに任せられる点が大きなメリットです。その分のリソースを、選手獲得のためのリサーチなど他の重要なタスクに充てることができ、結果として他クラブと比べてチーム強化という目的において競争優位性を保つことが可能になります。
現代サッカー、特に欧州では、選手の走行距離や被ファウル数、ドリブル距離など、さまざまなデータが活用されており、データに基づいた選手獲得が当たり前になりつつあります。
私自身、研修を通じて初めてDatabricksという存在を知りましたが、漠然と「Databricksとは何か?」と学ぶより、自分の興味のある分野と結びつけて理解することで、より深く頭に入ることを実感しました。
今後もこのような記事を参考にしながら、引き続き学びを深めていきたいと思います。