過去1ヶ月の記事25件をAPI経由で取得し、生成AIで要約と傾向分析を自動生成しています。すべての処理は自動で行われています。
最終更新: 2026-06-03
最近の著者の傾向
主要な注力テーマ
-
生成AIとLLMOps
生成AI技術を中心に、LLM(大規模言語モデル)を活用したアプリケーションやその運用(LLMOps)に関する記事が多く見られ、特にMLflowを用いたトレーシングや評価方法が注目されています。 -
MLflowの活用
MLflowに関連する記事が多数あり、特にトレーシングやプロンプトの管理、評価方法に関する具体的な実装例が提供されています。これにより、機械学習モデルのライフサイクル管理が強調されています。 -
データエンジニアリングとETL
データ取り込みや特徴量エンジニアリングに関する記事があり、特にUnity CatalogやLakeflow Connectを利用したデータの整備や分析手法が紹介されています。 -
AIエージェントの構築
自律型AIエージェントやカスタムコードエージェントの構築に関する記事があり、生成AIを用いたエージェントの実装や評価手法が探求されています。
技術的特徴
-
実践的アプローチ
記事では実際のコード例や具体的な手法が多く取り上げられており、読者が実践的に学べる内容が多い。 -
評価と改善のフレームワーク
モデルやシステムの評価方法に関する詳細な説明があり、特にMLflowを用いたトレーシングや改善案の生成が強調されています。 -
マルチモーダルなアプローチ
動画や音声データを基盤モデルに直接入力する方法など、マルチモーダルなデータ処理に関する技術が取り上げられています。 -
最新技術への適応
Databricksの新機能や最新の技術トレンドに対する迅速な適応が見られ、常に最新の情報を提供する姿勢が強調されています。
傾向分析
| カテゴリ | 主要技術・テーマ | 具体的な取り組み |
|---|---|---|
| 生成AI | LLMOps | LLMの評価やトレーシング手法をMLflowで実装 |
| データエンジニアリング | ETL | Lakeflow Connectを使用したデータ取り込みの全体像 |
| MLflow | モデル管理 | MLflow Prompt Registryでのプロンプト改善の段階的リリース |
| AIエージェント | 自律型エージェント | Databricks Free Editionを用いたエージェントの体系的理解 |
| マルチモーダル | 動画・音声処理 | 基盤モデルへの直接入力方法の提案 |
記事ごとの要約
[2026-06-03] もうフレーム抽出はいらない: Databricksで動画・音声を基盤モデルに直接入力する
Databricksが新たに音声と動画を基盤モデルに直接入力できる機能を追加しました。これにより、従来のフレーム抽出や文字起こしが不要になり、動画ファイルや音声ファイルをそのまま渡せるようになりました。入力方法は、公開URLまたはBase64エンコードされたデータを使用します。Geminiモデルが音声・動画入力に対応しており、セットアップには必要なライブラリのインストールとAPIトークンの取得が含まれます。
[2026-06-01] RAGの評価に正面から向き合う ― 検索と生成、どちらが失敗したかをMLflowで切り分ける
この記事では、RAG(Retrieval-Augmented Generation)の評価方法をMLflowを用いて解説しています。RAGは検索と生成の二段階プロセスであり、検索の品質だけでなく、生成された回答の正確性も評価する必要があります。MLflow 3のGenAI評価機能を活用し、RelevanceToQuery、RetrievalGroundedness、RetrievalSufficiencyの3つのスコアラーを用いて、検索と生成の問題を切り分ける手法を紹介しています。これにより、RAG全体の応答品質を包括的に評価できるようになります。
[2026-06-01] Strands Agents を Databricks の基盤モデル + MLflow Tracing で動かす(stream_options のハマりどころつき)
Strands Agents SDKは、AWSが提供するオープンソースのAIエージェント構築用SDKで、モデル駆動設計に基づき、自律的にツールを呼び出すエージェントを簡単に定義できます。本記事では、このSDKをDatabricks上で活用し、推論とトレースをすべてDatabricks内で完結させる方法を紹介します。特に、MLflow Tracingを利用してエージェントの動作を記録する点が強調されており、外部サービスを介さずにDatabricksの基盤モデルAPIを利用する構成が提案されています。
[2026-05-30] MLflowでDatabricks Genieスペースを評価・改善する — トレーシングからLLMジャッジ、自動改善案生成まで
本記事では、Databricks Genieスペースの運用における課題を解決するため、MLflowを用いた評価・改善手法を解説しています。具体的には、Genieの会話をトレースし、LLMジャッジで品質を評価し、失敗したトレースから自動的に改善案を生成する3ステップを実装します。Databricksノートブックを活用し、必要なパッケージのインストールやエクスペリメントの設定から始め、会話の記録を行う方法を示しています。
[2026-05-27] MLflowトレースのPIIマスキング — Unity Catalogカラムマスクとai_mask() ETLの2層構成
Databricks上でのMLflowとUnity Catalogを統合し、トレースデータ内の個人識別情報(PII)を部分的にマスキングする手法を紹介。標準のカラムマスキングは全体を置換するが、カスタム関数を用いて特定部分のみをマスクする。推奨する2層構成は、正規表現を用いたカラムマスクと、ETLパイプラインのai_mask()を併用し、リアルタイムとバッチ処理でPIIをマスクする。MLflow UIでの確認も可能。
[2026-05-27] 【無料】Data + AI Summit (DAIS) 2026 バーチャル体験のご案内 ― 自宅からDatabricks最大のカンファレンスに参加しよう
2026年6月15〜18日にサンフランシスコで開催されるData + AI Summit (DAIS) 2026に、バーチャル体験が無料で提供されます。日本時間の6月17・18日にキーノートやセッションが視聴可能で、再配信は日本語同時通訳付きです。著名なスピーカーにはDatabricksのCEOやOpenAIの共同創業者が登壇し、AIやデータエンジニアリングに関する800以上のセッションが用意されています。登録は簡単で、メールアドレスがあれば数分で完了します。
[2026-05-26] MLflow 3 の評価をライフサイクルで捉える — オフライン評価と本番トレース評価
この記事では、MLflow 3を用いたGenAIアプリの評価プロセスについて解説しています。中心となるAPI mlflow.genai.evaluate()を使用し、オフライン評価と本番トレース評価の2つの段階を実装します。オフライン評価では手元のデータを用い、本番トレース評価では既存のトレースを評価します。評価はライフサイクルに沿って行われ、オンライン評価への移行も視野に入れています。特に、predict_fnの有無による評価モードの違いに注意が必要です。
[2026-05-25] Lakeflow Connect 入門 — データ取り込みの全体像を理解する
Lakeflow Connectは、外部システムからのデータ取り込みを簡素化するマネージドサービスです。主要なSaaSアプリやデータベース向けに30以上のコネクタを提供し、UIまたはコードでインジェストパイプラインを構成可能です。データはUnity Catalogで管理され、サーバーレスで動作し、増分取り込みも自動化されます。SaaSコネクタは設定が簡単で、データベースコネクタはより複雑な準備が必要です。これにより、データエンジニアは分析に集中できる環境が整います。
[2026-05-23] 組み込み関数で済むのにUDFを書くと何倍遅いのか — Spark UDFの使い分けを実測で整理する
この記事では、Sparkにおけるユーザー定義関数(UDF)の使用に関するパフォーマンスの違いを実測し、組み込み関数とUDFの使い分けを整理しています。具体的には、カウントアップ処理を例に、組み込み関数、スカラーUDF、Pandas UDFの4つの実装方法を比較。組み込み関数が最も効率的で、UDFを使うこと自体が問題ではなく、組み込み関数で表現できる処理をUDFにすることがアンチパターンであると結論付けています。
[2026-05-22] Databricks 宣言型特徴量エンジニアリング入門: オフライン経路で動かして理解する
Databricksの「宣言型特徴量エンジニアリング」は、特徴量の定義を宣言するだけで、計算やテーブル化をプラットフォームが自動で行う新しいAPIです。従来の手続き型では、集計コードを自分で書く必要がありましたが、宣言型では仕様オブジェクトを登録することで、時点正確性を保証しつつ、プレビューや学習が可能になります。これにより、特徴量の定義と実体化が分離され、効率的なデータ処理が実現します。
[2026-05-20] MLflowのトレースをUnity Catalogに保存してSQLで分析する ― OpenTelemetry連携ウォークスルー
MLflow 3のトレースデータをOpenTelemetry形式でUnity CatalogのDeltaテーブルに保存する方法を解説。これにより、SQLを用いてトレースデータを直接分析可能となり、MLflow UIでは難しい詳細な分析が実現できる。記事では、UC trace storageのセットアップからSQL分析までの手順を示し、トレースデータが4つのDeltaテーブルに格納されることを説明。主なメリットには、アクセス制御の簡素化や他システムとの互換性向上が含まれる。
[2026-05-19] Databricks Unity AI Gateway (Beta) のカスタムガードレールを LLM-as-a-judge で実装する
DatabricksのUnity AI Gateway(Beta)では、カスタムガードレールがLLM-as-a-judge方式で実装され、従来のMosaic AI Gatewayから大幅に進化しました。新しいアーキテクチャでは、推論エンドポイントと評価エンドポイントが連動し、入力と出力のガードレールが柔軟に設定可能です。ユーザーはプロンプトを自由に記述し、評価モデルを選択できるため、カスタマイズ性が向上しました。設定は5ステップで行え、権限要件も明確にされています。
[2026-05-18] ジャッジを評価するジャッジ ― LLM-as-a-Judgeの信頼性をメタ評価で保証する
本記事では、LLMジャッジの信頼性を評価するためのメタ評価手法を紹介しています。具体的には、Cohen's kappaを用いてジャッジの判定が人間の判断とどれほど一致しているかを数値化します。偽陰性や偽陽性、体系的バイアスのリスクを避けるため、ジャッジの正確性を検証する必要があります。メタ評価は、ジャッジの判定と人間のラベルを比較し、一致率を計算することで行います。kappa値が0.6以上であれば、実用的な一致と見なされます。
[2026-05-17] LLM-as-a-Judgeの設計 ― make_judge と Python scorer を使い分けて LLMアプリの品質を測る
本記事では、LLMアプリの品質を測定するための2つの手法、LLM-as-a-JudgeとPython scorerを紹介しています。LLM-as-a-Judgeは質的な判断を行うのに適しており、Python scorerは決定的な検証に向いています。顧客サポートのトリアージアプリを例に、ハルシネーション、意図整合、礼節、スキーマ準拠の4つの観点で評価を行う方法を解説しています。これにより、コストと網羅性のバランスを取ることが可能です。
[2026-05-14] Databricksにおけるカスタムコードエージェントの構築 2026年エディション
Databricksでのカスタムコードエージェントの構築に関する記事では、エージェントの主要コンポーネントをプロンプト、コネクション、ロジックに分類し、顧客サービスの例を通じてその機能を説明しています。大規模言語モデルと連携するために、複数のプロンプトやAPIを用いた接続が必要であり、メモリーモジュールの追加が重要です。また、エージェントの管理や監視の必要性も強調され、ビジネスプロセスの自動化における課題とベストプラクティスが提案されています。
[2026-05-13] Databricksメトリクスビューのウィンドウメジャーを試す
Databricksのメトリクスビューに新たに追加された「ウィンドウメジャー」は、時系列分析の計算をYAML定義内で宣言的に行える機能です。これにより、移動平均やYTDなどのKPIがセマンティックレイヤー内で一貫して管理でき、ダッシュボード間の定義の不一致を解消します。ウィンドウメジャーは、集計の順序や範囲、半加法属性を設定することで、相対的な集計を可能にします。これにより、ユーザーはSQLやBIツールでの再実装を避けられます。
[2026-05-13] MLflow Prompt Registryでカナリアリリース ― プロンプト改善を段階的にリリースする
MLflow Prompt Registryを用いたカナリアリリースの手法を解説する記事です。プロンプトの改善を段階的に行うことで、本番環境でのリスクを軽減します。カナリアリリースは新バージョンを一部トラフィックに流し、問題がないか確認してから全体に展開する戦略です。記事では、ユーザーIDのハッシュを用いた振り分けロジックを設計し、MLflowのalias機能を活用してプロンプトのバージョン管理を行います。これにより、ユーザー体験を安定させつつ、メトリクス比較も容易になります。
[2026-05-12] Databricks Apps のユーザー認可をサンプルアプリで体感する — 同じ SELECT で 0 行 vs 3 行
Databricks Appsのユーザー認可(On-Behalf-Of)をStreamlitサンプルアプリで体験する方法を解説。アプリ認可(Service Principal)とユーザー認可の違いを明示し、同じSQLクエリで異なる結果(0行 vs 3行)が得られる様子を示す。ユーザー認可では、ログイン中のユーザーの権限が適用され、行フィルターが効くため、個別データの取得が可能。サンプルコードはGitHubで公開されており、実機検証済み。
[2026-05-11] Databricks機能一覧(2026年5月版)
2026年5月版のDatabricks機能一覧では、主な変更点として「宣言型自動化バンドル」への名称変更や、AIコーディングアシスタント向けの新機能が追加されたことが挙げられています。主要機能には、Delta Lakeによるデータ基盤、Unity Catalogによるガバナンス、LakeflowによるETLパイプライン、生成AI向けのエージェントフレームワークなどが含まれます。また、データの取り込み、加工、分析、共有に関する推奨機能も整理されています。
[2026-05-11] Databricks Agent Bricks: Knowledge Assistant を東京リージョン・日本語ドキュメントで試す
DatabricksのKnowledge Assistantは、社内ドキュメントに基づくQ&Aチャットボットをノーコードで構築できるサービスです。Vector SearchインデックスやRAGパイプラインの構築を不要にし、引用付きの高品質な回答を提供します。日本語ドキュメントへの対応は進行中で、東京リージョンでも利用可能です。主なユースケースには製品ドキュメントや人事ポリシーに関するQ&Aが含まれ、利用には特定のワークスペース要件が必要です。
[2026-05-11] Databricksサーバレスノートブックで %uv pip が使えるようになりました
Databricksノートブックで新たに導入された%uv pipマジックコマンドは、Rust製のパッケージマネージャーuvを利用し、従来の%pipよりも高速にPythonライブラリをインストールできます。この機能はサーバレスノートブックの環境バージョン5以降で利用可能で、依存ツリーが深いパッケージでは約3倍の高速化が確認されています。%uv pipは%pipと同じ仮想環境を共有し、互換性も保たれています。
[2026-05-09] AIエージェント=自律型ではない: Anthropic「Building effective agents」のワークフロー型をDatabricks Free Edition + MLflow Graphビューで体系的に理解する
この記事では、Anthropicが提唱するAIエージェントの「ワークフロー型」と「自律型」の違いを解説しています。ワークフロー型は開発者が経路を定義し、各ステップはLLMが処理する非決定論的な構造で、予測可能性やデバッグの容易さが利点です。自律型はLLMが経路を動的に決定し、柔軟性を持つ一方で、コストやリスクが高まる可能性があります。具体的なワークフローパターンも紹介され、Databricksでの実装例が示されています。
[2026-05-08] Databricks Free EditionだけでLLMOpsのコアループを1周する
本記事では、Databricks Free Editionを用いてLLMOpsのコアループを実践する方法を解説しています。LLMOpsは、生成AIアプリの運用を継続的に行うためのプロセスで、プロンプト管理や評価、デプロイを含みます。Free Editionでは、MLflowやFoundation Model APIsなどの機能を活用し、架空のベーカリーチェーンの顧客レビューから構造化インサイトを抽出するエージェントを開発します。記事では、開発から運用までのステップを示し、MLflowを用いたトレースの重要性も強調しています。
[2026-05-08] DatabricksノートブックとSQLエディタの結果テーブルでネイティブなデータプロファイリングが使えるようになりました
Databricksの2026年5月1日のアップデートにより、ノートブックとSQLエディタの結果テーブルでネイティブなデータプロファイリング機能が追加されました。これにより、列ヘッダーを選択し「選択内容の詳細を開く」をクリックするだけで、その場でプロファイリング統計を確認できます。従来の方法では、別途プロファイルを生成する必要がありました。新機能は特定の列の迅速な確認に適しており、従来の方法はDataFrame全体のサマリーに向いています。
[2026-05-05] Databricks Genie (旧Databricks One) チャットの「スケジュールされたタスク」を試す
Databricks Genieの新機能「スケジュールされたタスク」は、自然言語で指示することで定期的なデータ確認やレポート送信を自動化できる機能です。ユーザーはチャットで依頼するか、UIから手動で作成することが可能です。タスクは指定した時間に実行され、結果はチャットスレッドやメールで受け取れます。Genieは旧Databricks Oneからリブランドされ、ビジネスユーザー向けの統合UIとして機能しています。