1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

DASH2025:米国Datadogイベントに今年も行ってきました

Posted at

DASH_byDatadog.png

来年 DASH2026 会場に行く人へ

DASH とは Datadogが毎年、北米ニューヨークで開催するカンファレンスです。日本からの参加者が昨年に比べて5倍に増えており、参加者のある人は昨年の記事 DASH2024を参考に渡米の準備をしたという嬉しいコメントを頂きましたので今年版をアップデートします。2026年のDASHに参加する人の参考になれば幸いです。

Datadog の進化

およそ10年以上前の情報システムの監視・モニタリングといえば、物理サーバーのCPUやディスクなどコンピュートリソースのモニタリングとネットワーク経由でPing応答を検査してサーバーが正常に稼働していることを監視するだけのいわゆるインフラ層を運用するための機能でした。Datadogも最初はサーバーの監視からスタートしているもののこの10年間で運用の手法を変えてしまうほど大きく進化し、アプリケーションとログの監視・モニタリングが加わり、データベース性能モニタリング、セキュリティ監視なども毎年、次々と新機能が追加され、現在ではユーザーの利用状況を含む情報システム全てのレイヤーを対象に観測可能なサービスへと大幅拡大してきました。
昨年のDASH2024では、生成AI自体をモニタリングする「LLM Observability」、攻撃経路やソフトウェアライブラリの脆弱性の対策をリコメンドしてくれる数々のセキュリティ機能、メール通知などのアラート手段に音声通話を加える「On Call」といった驚きの発表がありました。今年はどんな発表があるのかとても楽しみに参加してきました。

DASH会場へのアクセス

毎年、ニューヨークのジャビッツコンベンションセンターで開催されます。近くの主要な駅 Penn Station からだと徒歩で約20分くらいです。ちなみに会場から Datadog本社 への移動は徒歩で約15分です。

渡航(羽田空港 ~ JFK空港 ~ New York City)

昨年はユナイテッド航空を利用してニューアーク空港で入国し、ニューヨーク州まで NJ Trangit 鉄道で移動したが、今年はJALを選びJFK空港で入国して、ニューヨーク市までLIRR(ロングアイランド鉄道)を利用。日本から参加するほとんどの人は空港からUberを利用したようです(鉄道で来たという話は聞けなかった)。大きな荷物になるキャリーケースもあるし、夜間に到着する人もいるので安全のためにUberを選んだとのことです。なお、今でも白タクは存在するようで必ずUberかイエローキャブ(深夜でも待機している)を見つけた方がよさそうだとの体験者談も聞けました。
私は昼間に空港到着だったのと、一人だったので観光ついでに空港内AirTrain($8.5)とLIRR(行き$8.25/オフピーク時[土日], 帰り$11.25/ピーク時[月-金])を使って合計$20弱で Penn Station まで移動しました。たまたまかもしれませんが、鉄道での移動に危険を感じたことはなかったです。
image.png

DASH会場

8時半ごろに行くと朝食もあり、Expoではランチを頂けます。ランチは混むので11:30頃に行くとテーブル席探しに困らなかったです。唯一のアドバイスはニューヨークの気温は28度くらいになるので半袖で過ごせるのですが、会場はとても涼しいです。ずっと座っていると凍えることもあるので調整できる上着は必需品です。会場5階にある屋上はよく陽があたり体を温めるのに最適でした。屋上からはハドソン川や今は博物館になっている空母も見えます。

image.png

基調講演 Keynote

広いです。後ろの方だと望遠鏡が必要なくらいステージが遠いです。後席の方には3台の大型ディスプレイがありますが、せっかくなので開演時刻より早く行って前方の席を確保した方がいいと思います。基調講演ではFortune 100 の企業の62%がDatadogを利用しており、AI企業においてはトップ10のうち8社が顧客となっているという、オブザーバビリティツールとしてDatadogを選んだパートナー企業/ユーザー企業にとっては心強いメッセージでした。

image.png

2025年の新機能・新製品

基調講演の冒頭から、昨年比176%以上の数の新機能が発表されるというメッセージに期待が高まります。

image.png

新機能の内容はというと、クラウドプラットフォームの監視・モニタリングはどこに行ったのだと思うほどガラリと変わって、情報システム全てのレイヤーに対する運用自動化やアプリを開発するためのAI機能が続々と発表された。ちなみに私たちインフラ寄りなプラットフォームSREからすると、もはやDatadogを採用するだけで「AIで運用しています」と訴求できそうなラインアップです。多くはプレビューですが、24時間365日の運用業務を自動化・省力化できるものであり、「観測性の向上」から「運用の自動制御」へ運用手法が変わっていこうとしているようです。今年の主な発表は以下の通りです。

1. 24時間働けるエンジニアのビッツが私たちのチームに加わるような夢のAIエージェント

ビッツというのは、Datadog創業チームが最初に監視していたサーバーの名前だったそうです。Datadogの親しみやすいロゴになっています。

  • Bits AI SRE Agent: インシデントが発生すると自動でトリアージを始めて過去データから仮設の原因を複数描き、それを検証して根本原因を特定する。さらにその事象を学習したり、特定した根本原因について質問したりできるAIエージェントが仲間に加わる

image.png

2. インシデント対応と自動化の進化(プレビューは1,000社以上が有効化する大人気さ)

  • Bits AI Voice Interface: 動画のデモでは、食事中にスマホから電話呼び出しがかかり音声合成と音声認識での双方向対話の事象確認をするものでした。事象把握をしたらパソコンの画面で対象のダッシュボードが開かれ素早く電話の続きから再開。TeamsやSlackで同僚が投稿しているチャットメッセージと同じものをダッシュボード側で閲覧できる。これなら社内VPNにアクセスしなくてもダッシュボードだけで仕事ができそうだ
  • Status Pages: 会社のステータスページを更新するためのテンプレート、カスタムドメインを使えて、お客様に自社サービスのステータスをお知らせすることができる

image.png

3. セキュリティ(Cloud SIEMにAIを導入する)

  • Bits AI Security Analyst: SOCチームがSIEMシグナルのトリアージに費やす時間を短縮。ここでもBitsが自動的に調査と解決策を推奨して調査手順を示して素早く修復することを可能にします。例えば、AWS Cludtrailやその他のルールを適用すると3つのいずれかの検証結果を提示する; Benign(懸念は検出されない), Suspicious(疑わしい), Inconclusive(人的に調査が必要)。ユーザー隔離やチケット起草など複数の対策候補が提示される

image.png

4. アプリ運用者をメンバーに加える

  • Bits AI Dev Agent: さまざまなAIエージェントプラットフォームがあるが、Datadogに統合されていることが特長。例えば、Bits Dev Agentがコードの問題を検知したらGithubにプルリクエストを起草し、Slackで通知してくれる。Bitsエージェントは普段からGithubコミットを追跡して検証してくれるようだ。これはプレビュー参加してみたい
    • プレビュー対象3つ Error Tracking, Code Security, Continuous Profiler だが、RUM, DBM, その他にも組み込まれていくようだ
    • この機能は Github インテグレーションが必要(現在,Githubのみ)
  • APM Investigator: 応答の遅いアプリを検出したら原因特定するところまでAIで自動化することで対策時間を短縮します
  • Proactive App Recommendations: 積極的に遅いアプリを事前に検出し対策候補を推奨してくるもの。影響を受けるユーザーの数など数値化もしてくれる

image.png

5. アプリ開発者のための統合ポータル

  • Datadog Internal Developer Portal: IDPは、ソフトウェアをカタログ化して全てのAPIサービスの構成(マイクロサービス間の構成や依存関係)、ドキュメント、リポジトリ、責任者などを自動的に可視化。さらにベストプラクティスとのギャップもスコアカードでチェックでき、インフラデプロイのリクエストもプルリク作成まで自動化。情報システム全体のアプリ開発者用のポータルになり得そうです

image.png

6. Datadog MCP Server

  • Datadog MCP Server: MCP対応のAIエージェントは Cursor, VSCode, OpenAI Codex からDatadogへアクセスして観測メトリックを取得できる。IDEのCLIでDatadogのグラフを表示できるようだし、Datadog内のインシデントステータスも取り込めるようだ。つまりアプリ開発者が触れるツールは[VSCodeとAWSマネージドコンソール]の2つだったのが[VSCodeとDatadogダッシュボード]に移行するように、今度は[VSCode]だけでアプリ開発も情報システムのオブザーバビリティも管理できるようになるという未来が現実になりそうです。でも可観測性なら一目で影響状態がわかるグラフのダッシュボードも捨てがたいな

image.png

7. ログ

  • 昨年発表された 90日間保存できる Flex Logs に加えて、長期ログ保管の要求に応えることができる最長7年間保存可能な Flex Frozen を発表。これでセキュリティとコンプライアンスに対応するプラットフォームとなった
  • 保存するだけでなく、検出と分析ができる Datadog Archive Search も登場
  • 更にさらに、Datadogダッシュボードの中で表形式にてまとめられるスプレッドシートDatadog Sheetsの機能も搭載されます

image.png

8. セキュリティ(AIエージェントに対する攻撃)

  • AIエージェントが普及すると新しいセキュリティ対策が必要になる。アプリケーション、AIモデル、データの各レイヤーで対策する
    • データ層では、情報取得のInputを検知して機密情報の漏洩を防ぐ機能として「センシティブデータ(トレーニング, プロンプト & レスポンス)」
    • AIモデル層では、悪意のあるAIモデルを検知すると自動的にプロセスを終了して防御、あるいはアクセスキーを奪って別の自分の目的のためにAIモデルを利用することで巨額な請求がされる攻撃など「サプライチェーン, モデルハイジャッキング, 他」が実装
    • アプリ層では、コードからクラウドまでエージェントツールの不正使用、新たなID攻撃、サービス拒否攻撃などの「プロンプトインジェクション, データポイゾニング(ランタイム)他」、多くの検知機能をサポートする予定
  • AIスタックでは既に5つのセキュリティ対策カテゴリが提供されています
    • コードセキュリティ(Code Security)
    • クラウドセキュリティ(Cloud Security, CSPMは既にこの機能の一部です)
    • クラウドCIEM(Cloud SIEM)
    • 脅威管理(Threat Management)
    • データセキュリティ(Data Security)

image.png

9. GPUモニタリング

  • GPU Monitoring: AIワークロードが研究段階から本番環境に移行するにあたってGPUのリソース不足、GPU間のNVLinkの輻輳/転送遅延、課金面で無駄なアイドル時間の3大課題を一元把握。稼働率、コスト、プロセス単位までブレークダウンしてボトルネックを突き止めるGPU投資を無駄なく使いきるための可視化が可能になる。クラウドだけでなくオンプレミスも観測対象のようだ

image.png

10. LLMオブザーバビリティ

  • AI Agent Monitoring: Datadog上でAIエージェントの実行フローが視覚化され、各ステップでのエラーや異常動作がすぐに追跡できる
  • LLM Experiments: モデルパラメータの調整、機能の評価、そして様々な形式の入力に対するアプリケーションの動作をより深く理解するのに役立つ
  • AI Agents Console: AI エージェントの動作を並べて監視できます。セッション数, 月額コスト, エラー率, アクティブユーザー数などを可視化し、効果の低いエージェントを検出し、さらに詳細な調査が可能

11. データの可観測性

  • Data Observability: Snowflake, Amazon Redshift, Big Query のDWHとTableauなどのBIという範囲だけでなく、JavaアプリやPostgreSQLデータベースを起点に例えば K8s microservice → ストリーミング Amazon Kinesis → ジョブ databricks → データセット Snowflake → 分析 Tableauまでのデータライフサイクル全体をカバーする唯一の製品

25個の新機能・新製品

2時間で25個の新しい機能を理解することはできないけど、どんな機能があったのか速攻で知ることはできたでしょうか。
image.png

でも実際に増えた機能はこちらとのことです。何千人ものエンジニアがひとつのプラットフォームで開発している進化の速いオブザーバビリティに期待が高まります。
image.png

要するに、Datadog はインシデント対応やセキュリティ、アプリ開発、アプリ運用をあらゆるレイヤーで自動化・可視化することで、AI時代のソフトウェア開発の基盤を提供しているという内容でした。さぁて、インフラ寄りなプラットフォームSREはいよいよ脱インフラOnlyを加速させてフルスタックエンジニアに成らねば。その手段がDatadogであり、Datadogを先んじて学習・技術習得することで自分たちの役回りを確立したい。

最後に

Datadogジャパンでは日本人向けの特別なイベントも準備いただいていました。お隣の韓国でも韓国Dayがあったようです。日本人向けの基調講演Recap、Datadogユーザー向けの本社オフィスツアーやパートナーサミット、日本人全員でのレセプションその他。出張の副次的プランかと思いますが、日本のユーザー企業やパートナー企業の皆様と会話をする貴重な機会でもありました。
米国イベント会場への渡航と今年の新機能についてのみ記載しました。現地でのスキマ時間や夜間の過ごし方などはDMくださったらシェアさせていただきます。

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?