本記事は個人の見解であり、所属する組織の公式見解ではありません。
この記事は「MLOps(LLMOps、生成AIOps、AI AgentOps) Advent Calendar 2025」の 23 日目の記事です。すみません、遅れましたm(_ _)m
はじめに
著者の感覚だと、MLOpsというワードは 2019 年頃に話題になり、専門のカンファレンスなどもありました。最近では、LLMOpsなどもあり、MLOps 自体の話も聞く頻度は少なくなった来た印象です。技術の衰退や人気は需要や時代にあわせてかわっていくべきなので必要ないのならそういうものかと思うことももちろんあるのですが、実際、私のプライベートで生成 AI 周りの相談を受けるときに話を聞いてみるとそれは ML のほうがビジネスへインパクト与える可能性が高いと思いますよ、と答えることは多々あります。
実際、下記のGithubのまとめでは、海外の Tech company では ML がビジネスに寄与できる部分が多いことがここからもうかがえます。
https://github.com/Engineer1999/A-Curated-List-of-ML-System-Design-Case-Studies
この状況は日本だけなのかと思って世界の状況はどうなのかと見ていると、海外の MLOps Community (日本の MLOps 勉強会とは関係はないです) でもpodcastやニュースレターをみるとAgentsなどの話がここ最近はほとんどな印象です。PyCon DE & PyData 2025 をみると MLOps のセッションがあり、ML をシステムに活用する話が多々ありました。今年の PyCon DE & PyData 2025 でどのようなセッションがあったのかみたいと思います。
1. PyCon DE 2025 の MLOps セッション
PyCon DEのMLOpsのセッションをみてみましょう。DevOpsも含まれているので、単純に MLOps ではないですが、ML などのワードはタイトルにはいっているので少なくないことは確認できます。
-
Guardians of the Code: Safeguarding Machine Learning Models in a Climate Tech World
-
GitMLOps – How we are managing 100+ ML pipelines in AWS SageMaker
-
Streamlining Python deployment with Pixi: A Perspective from production
-
Scaling Python: An End-to-End ML Pipeline for ISS Anomaly Detection with Kubeflow
-
Going Global: Taking code from research to operational open ecosystem for AI weather forecasting
-
Oh, no! Users love my GenAI-Prototype and want to use it more
-
You don’t think about your Streamlit app optimization until you try to deploy it to the cloud
-
Size matters: Inspecting Docker images for Efficiency and Security
13 talks 中 ML のワードがはいっているのは 4 つ、実際のトークの内容を 生成 AI によみこませ ML のトークかどうか聞いたら、9 セッション (約70%)がMLのセッションと回答されました。
トピックは、大規模運用の MLOps からセキュリティなど幅広く見られます。
2. 日本の MLOps 状況との差異
トークで使っているツールは Kubeflow, SageMaker, Github actions, Kubernates など日本で MLOps に使われるツールとしては、そこまで大きな違いは見られません。
登壇者の所属は日本のテクカンファレンスとは少しことなるようにみうけられます。エネルギー企業の E.ON, EC サイトを運営している idealo 社などは日本でもDeNAさんやメルカリさんなどがよく登壇されているのでこのあたりと一致しているのですが、国際宇宙ステーション(ISS)のテレメトリデータ異常検知において大学の研究員がはなしたり、ECMWF(ヨーロッパ中期予報センター、ざっくりいうと気象庁の気象研究所の欧州国際版)の方が話したりするのは日本ではあまりみられない特徴かと思います。
こういった点からも研究機関含め Python コミュニティでの技術共有が盛んなことが伺えます。
3. 具体的なセッションを2つ
では具体的にどんなことが話されたのか著者が気になったトークから簡単な内容と感想を書きたいと思います。
3.1 Guardians of the Code: Safeguarding Machine Learning Models in a Climate Tech World
1komma5のエンジニアである Doreen Sacker さんによる発表です。OWASP によって Machine Learning Security Top 10 公開されており、各項目にたして対策案を提案しています。敵対的攻撃 (Adversarial Attacks)には、攻撃する側にいる人が入力データに微小なノイズを加えることで、モデルにご分類を引き起こさせる手法です。講演者はAdversarial Trainingという事前に敵対的な学習データとして、モデルに耐性をもうけることや、入力データが来る前にノイズを除去する層を導入することを提案しています。
また、攻撃者が悪意のあるデータをトレーニングデータセットにデータを汚染し、最終的なモデルにバックドアを作成する手法、データポイズがあります。このデータポイズニングに対して、長期的なデータを保管し、どの地点のデータが汚染され、そのデータをどの時点のモデルで学習されたのかバージョン管理されていないともとに戻せません。そのような環境がなければ、汚染が確認していないデータをすべてつかってモデルをつくることになります。このように Data Version Control、 DVCのような考えかたで実現可能です。
他にもモデルセキュリティに対する課題と解決案はありますのでよかったら YouTube をご覧ください。
3.2 Scaling Python: An End-to-End ML Pipeline for ISS Anomaly Detection with Kubeflow
こちらは Christian Geierさん, Henrik Sebastian Steude さんによる, Kubeflow を活用してスケーラブルなエンドツーエンドの機械学習パイプラインを構築する方法について解説した講演です。ISS(特にコロンバスモジュール)の複雑なテレメトリデータ (遠隔測定データ)は異常を遠隔地から検知することが非常に重要ですが、その検知システムの構築にデータサイエンティスが構築/管理は非常に負担になっていました。そこで、Kubeflowのエコシステムをフル活用し、インフラの複雑さを隠蔽しつつ、すべてをPythonコードで完結させるアプローチを紹介しています。つかっているツールとしては、Dask, Katib (ハイパーパラメータ最適化), PyTorch, MLFlow, KServeを用いています。
Kubeflow の Python SDK を使用することで、データサイエンティストは Kubernetes の設定ファイル(YAML)を直接触ることなく、Python コードのみで複雑なパイプラインを定義・実行でき。また、パイプライン化により、実験の再現性が担保され、データ量の増加に対してもクラスタリソースを使って柔軟にスケール可能で、これにより再現性とスケーラビリティが可能になります。また、 前処理からデプロイまでが一気通貫で自動化され、保守性の高いワークフローが確立することができるとのことです。
技術は日本の企業での事例でみかけるものですが、ISS の機器の異常検知に使われているという点がとてもユニークで、日本の研究機関でも適応できる可能性が高いことが面白い点だと思います。
詳細は YouTube をご覧ください。
4. まとめ
いかがでしたでしょうか。MLOps / ML に関するビジネス/研究分野への応用は数年前より広がり、ML を扱ううえで一層必要不可欠な技術/知見になってきたと感じました。ML だけでもビジネスへの寄与できることは再確認できたので私は学びになりました。
これらセッションなどをみて、世界における MLOps の活用状況について興味がでてきたので、今後も世界のテックカンファレンスなどを通じて自分の視野を広げていきたいと思います。