🚀 SRE1年生の僕にとってうってつけのイベント
2カ月前まで以下の単語を知らなかった。ログはまあ分かるとして、メトリクス、トレース、オブザーバビリティ、Grafana、Prometheus、OpenTelemetry、など。つまりSRE1年生の僕にとって今回のイベントはうってつけであり、とても良いタイミングだった。
実際に行ってみて、実務の1ヶ月分ぐらいの価値があったかなと思う。正直セッションはめちゃ良いのもあったけれど、分からないのもちらほらあった。個人的にはプロファイルのセッションが本当に良くて、これはかなり理解が進んだ。
スピーカーとの交流は難しかった
今まで出たカンファレンスの中ではスピーカーの人との話はあまり出来なかった方だけど、それはやっぱり質問するにはある程度の前提知識が必要という示唆だと思う。懇親会でも殆ど話せなかったし。
スポンサーブース活用が正解だった
ただ、スポンサーに質問しまくれたのはとてもプラスになった。考えたら、講演は後からでもオンライン配信があるなら見直せるが、監視ツールの会社の人にこれだけ質問出来る機会はなかなかないので、そういう意味でもとても良い時間だったなと思う。
サインをもらいそこねたのが一番の失敗
イベントの使い方としては大正解だったかも。ただ折角 「オブザーバビリティエンジニアリング」持っていったのにサインもらいそこねた のだけは失敗だったな。後から著者の人何回か見たけれど、そこに切り込んで行ける程英語力も自信ないし。というか日本人の人ですら良かったセッションがあってもアスクザスピーカーで話しかけに行けなかった、タイミングとか、人の流れとか…ぐらいなのでどっちにしても無理かもねw。
⚠️ 注意事項
忌憚なくスポンサーの体験を書いていますが、これがそれぞれのツールのポテンシャルを正しく引き出せているとは思いません。実際には僕の知識不足で実はもっと凄い機能がいくらでもあった可能性はありますが、あくまで話して感じたことのリアルです。
午前 - Liz Fong-Jonesのセッションと、まさかの満席
Liz Fong-Jonesのセッション - 英語の壁
まず最初はLiz Fong-Jonesの「Affordable Observability: Strategy to Implementation」。これは座る席を間違えて同時通訳がかなり見づらい席だった。英語で聞こうと思ったけれど、やっぱり専門用語も多くて全くついていけず、途中から見づらいなりに見ながら英語にも耳をかけ向けつつ、なんか忙しかった。まあ英語力と理解力の低さなのでしょうがないが、あまり零れ落ちるエッセンスなどは掴めず、刺さるものを感じ取る事すら出来ず。しょうがない!絵は自分で全部書いたとのことで凄い。可愛い!と思った。その後も何度か、Lizを見たけれど、話しかけられず。んー。色々話したかった…。
まさかの満席 - スタンプラリー開始
次のセッション「可観測性は開発環境から、開発環境にもオブザーバビリティ導入のススメ」に入ろうとしたら既に満席で入場すら出来ず。後日配信で…あらら。しょうがないのでスポンサーのスタンプラリーを始めることに。
スポンサーブース巡り - 各社の監視ツールを徹底比較
Grafana Labs
最初はもう君に決めてた。今回ある意味一番話が聞きたかった相手。Prometheus入れてメトリクスとれるようにして、ログも繋いで、OpenTelemetry使ってトレースとれるようにして、最近はプロファイルも入れた。で次の一手は何をしますか?という話を聞いた。これに関してはあまり明確な回答は得られなかった。多分開発の人ではなかったのか、それほど難しいこと聞いたつもりもなかったけれど、後から調べて回答しますみたいな感じで、あれ、もっといくらでもやること引き出せるのかな?と思っていたので、ちょっとその辺は残念。
Mackerel(はてな)
次に聞いたのははてな。Mackerelについて、実際に見せてもらったり、質問したり。ただ、正直な事を言うとPrometheusの延長線上にあるUI/UXが優れたものという感じで、やっていることは大きく違うとは思えなかった。特に個別の機能が凄いとか、Prometheusでは出来ないことが出来るなという印象は持てなかった。
Splunk - ログサービスの歴史とAI活用
次にはSplunk。このサービスは知らなかった。CISCOがやっているって。でも聞いてみると結構しっかり歴史はあるみたいで、元々ログを取得するサービスをもっていたとの話だった。あとAIには力を入れているみたいで、ここは参考になる部分が多かった。Grafanaも最近MCP入れてみたけれど、これによってAIに任せられる部分は増えそう。そもそも問題が起きた場合にMCPによって本当の問題に近づくアプローチはしやすくなるし、状況によっては修正までしてくれることも出来るだろうなと思った。実際そういう感じにAIを使っていけるという話になって、これはどの監視ツールでも同じだと思うけれど、AIで監視を進化させていく方向性は結構クリアになった。
ランチタイム - お弁当とネットワーク可視化
お弁当を逃した失敗
で、お昼に出て帰ってきてみたらなんとお弁当配ってて、完全に失敗した。まさかお弁当まで出るのか。それにしても今回スポンサーがついているせいかお金かかっているなとめちゃ思った。飲み物ももらえるし、飲茶スペースにはおやつもあるし。こんなイベントやったことはないわ。
ネットワーク可視化 - 人の流れが見える
フラッと行った場所にネットワーク専門部隊がいて、ネットワーク状況をGrafanaで可視化していて面白かった。ネットワークを見れば人の流れも分かるし、セッションの人気とかまで大体分かるという話はなるほどだし、そういう数え方があるのかと感心までした。可視化されて一気に減るタイミングの理由とかも面白かった。その相手が衛星とか優先の場合はネットワークゆずるしかなくてガクッと落ちる。まるで救急車みたいだなと言ったら、「あ、まさにそれ」と言われた。
PageDuty、Warroom - インシデント管理に特化
インシデントに特化したツールの話も聞けて、あ、そこって特化する所なんだというのは気づいてなかったので、面白かった。PageDutyはまさにそんな感じで、まあナレッジを貯めておくのは絶対的にプラスで、このサービスを作ろうという発想は自分にはなかったので目の付けどころがシャープだなと思った。たしかどっちも監視はSplunkと聞いて、お、そういう導入があるんだというは驚いた。
コンサル系企業 - 導入支援という選択肢
それとコンサル的な会社も。監視ツールの導入の支援みたいな感じで。大体同じように、全部こちらがやると定着していかないから支援して最終的には自走してもらうことが目的みたいな話になって、これはインフラと全く同じだな。と思った。CI/CDを普及させるときって導入のハードルよりも普及のハードルが随分高いという話をしてこれは共感できる部分が多すぎるのでかなり話が盛り上がってしまった。それそれ。
予算計上の難しさ - インフラあるある
あと思ったより料金が安かった。これを安いと言えるか微妙なラインで ツールとして導入するなら高い。但し、専用の人間を雇うとすると大分安い。 そんな価格設定。この辺の話は懇親会でも何となく話した人もかなり共通認識の人が多くて、ああ、オブザーバビリティの文脈でもまったく同じなのねという感じが強かった。まあインフラ部分でそれだけがお金を生むわけではなくて、何かあった時にかかるお金が減るという話だから予算計上とかもしづらいのは分かる。リファクタリングと同じで。ってこの話は永遠に出来そうな気がする。
🌃 午後 - 待望のセッションと徹底比較
プロファイルとAIエージェント - 道具の使い方が見えた
楽しみにしていたセッションが、「プロファイルとAIエージェントによる効率的なデバッグ」と「AIスパコン『さくらONE』のオブザーバビリティ」。プロファイルめちゃ良かった。Grafanaにプロファイル入れた時は、え?このレベルでどうやってプロファイルみると?と思ったのが正直なところだったけれど、このセッションを聞いてなるほど使えるかもとなった。パフォーマンスはかなり好きで慣れていて、熟してきたので今回のセッションで道具の使い方は結構分かったと思う。大分見えた。さくらの話は自分がやるべき仕事との類似性が強かったので、終わった後、一緒に来ていたメンバーの人と話に行って大分盛り上がった。やっぱこういう時2人で話しかけられると強いなと思った。来年は発表する側に回りたいなとちょっと思った。テーマ的にはスパコンと近いものがあるし。
本命 - DataDogとNewRelicの徹底比較
で、一本セッションは飛ばして一番聞きたかった。DataDogと、NewRelicの人の話を聞きに行った。どちらも率直に凄いなと思った。個人的には特にDataDogかな。
DataDog - 三位一体のUI/UXに感動
UI/UXも洗練されているし、関連するデータの密集度というか結合度というかログトレースメトリックスが三位一体になっている感じが凄くした。これはGrafanaや他のツールからは感じ取れなかった点で、それぞれがバラバラになって集めたデータが、このUIによって全部意味があるまとまった情報になっているなと感じた。正直データ量が少なければお金もそれほどかからないという話で、実際目指すだけ目指してその上でこういうサービスを使うってのは全然アリだし、思ったよりお安くいけるかもとは思った。
NewRelic - 熱意ある担当者が好印象
NewRelicは担当した人が見せたいものがあるって感じで頑張ってくれて好感が持てる感じだった。技術者かな?どうも自分はこういう人に好印象で営業っぽい、技術の話に対して熱量を感じない相手だといくら素晴らしいツールでも真価が伝わらないので、エンジニア目線で言えば損しているスポンサーも多いだろうなと思った。やっぱりこの直接デモでかなり印象変わってしまって、購入のきっかけになるケースはあると思うので。
個人的な総合評価
で、NewRelicはDataDogに比べるとUI/UXの洗練は少し劣るなと思った。もちろんGrafanaに比べれば全然優れているけれど。UI/UXは劣るが、問題解決力はこちらが上かなと思った。説明が上手かったプラス点はあるかもしれないけれど、個人的にはDatadog、NewRelic、Splunk、Mackerelの順番かな。
🤝 クロージング、そして懇親会
で、その後セッションを聞いて、得られるものもあったし、大分疲れてきているせいで、すーっと抜けていくものもあったけれど、最後のクロージング、懇親会まで含めて大満足だった。懇親会は、性分的に割り込んだり、自己アピール出来ないのがわりと悪い方向に転んであまり話せなかったけれど、得意分野の勉強会でもこういう時はあるので、まあこの辺はしょうがないかなと思ったり。
✨ まとめ
SRE1年生にとって、このオブザーバビリティカンファレンスは実務の1ヶ月分ぐらいの価値があった。セッションから学ぶこと、スポンサーブースで直接ツールを触って質問できること、そしてネットワーキング。全てが初心者の僕にとって貴重な体験だった。
特にスポンサーブースを回って各社のツールを比較できたのは大きかった。商用ツールとOSSツールの違い、それぞれの強みと弱み、そしてAIの活用方法まで、生の声を聞けたのは本当に良かった。来年は発表する側に回りたいな、と思える良いイベントだった。