この記事は、Elixir Advent Calendar 2024 シリーズ13 の18日目です
piacere です、ご覧いただいてありがとございます
2024年末の時点で、Elixirにいったい何が出来るのかを紐解いていくシリーズで、前回は「⑤2024年のWeb/スマホ/マイクロサービス編」 でしたが、今回は「⑥2024年のAI・LLMトレンドから2025年のElixir AI・LLMを占う編」です
2024年のAI・LLMトレンドを振り返り、そこから2025年のElixir AI・LLMを占ってみます
Elixir自体に、まだあまり興味がそこまで湧いていない方でも、2024年末におけるAI・LLMシーンを把握できるのでオススメです
逆に、Elixir AI・LLMが、何をどこまで出来るかを知りたい方は、下記コラムをご覧ください
本シリーズの全体像は、下記になります
There are 13 Elixir Advent Calendar, making for a hot winter!
Over the past 7 years, Elixir has consistently been a top-ranking language in the programming category of the Advent Calendar, claiming the #1 spot last year. This year, too, Elixir is sure to stay at the top.
We’re feeling the excitement again this year… Please support or subscribe!
https://qiita.com/advent-calendar/2024/elixir
https://qiita.com/advent-calendar/2024/ranking/feedbacks/categories/programming_languages
2024年末までの世間のAI・LLMムーブメント
今年のAI・LLMムーブメントについて整理してみます
①今年1年に進化した技術面
a)マルチモーダルAIの飛躍的な発展/社会実装
昨年末に登場したマルチモーダルAI、つまり、複数のモダリティを統合して処理するAIが著しく発展しました
マルチモーダルAI自体が何者かは、下記コラムを参照してください
マルチモーダルがどのようにして実現されているかは、下記コラムが参考になります
代表的なモデルで言うと、下記の通りです
- Google Gemini Nano/Pro/Ultra
- OpenAI GPT-4o
- Anthropic Claude 3
- DeepMind Flamingo(OpenFlamingo) 2
- DeepMind Gato
- CLIP
- Google PaLM-E
- Llama 3.2
- Mistral AI Pixtral Large
- DeepMind Perceiver IO
- Microsoft DeepSpeed
うち、GPTシリーズとClaudeシリーズは、マルチモーダルAI以前から有名でしたが、マルチモーダルAIの急先鋒であるGeminiが2023年末に登場したことにより、一気にマルチモーダル化の波が訪れました
その基盤技術として、昨年コラムにて、「自己教師付き学習」が伸びてくる と予想しましたが、予想通りでした
続いて、LlamaやMistral、Perceiver IO、DeepSpeedのようなOSSもマルチモーダル対応してきました
これらマルチモーダルAIモデルが使われている、代表的なプロダクトは、下記の通りです
企業も、マーケティング/広告やデザイン、エンターテインメント、プロダクト開発におけるクリエイティブプロセスにおいて、積極的にマルチモーダルAIを活用し始めており、消費者やファンがそれを目にする機会も増えました
今後は、「ゼロショット」、つまり特定のモダリティだけで無く、未知のモダリティやタスクを即座に処理する能力がさらに進化していくと予想されます
また、テキスト/画像/音声/動画だけでなく、触覚や嗅覚をセンサー等で拾うことで、新たなモダリティに対する対応も充実していくでしょう
そうこうするうちに、現実世界の事象が、次々とデータ化され、下記の2024年初めに登壇したような「デジタルツイン+生成AI」の世界 … つまり、「現実とデジタル/バーチャルが地続きとなって影響・改変し合う」といった世界は、実はそんなに遠い未来では無くなりつつあります
こうした変化を通じて、2025年は、社会の様々な分野で基盤技術ないしはユーザーとの自然なインタラクション要素としてのマルチモーダルAIが広がる重要な年となる予感がします
なお、Elixir AI・LLMは、上記Pythonで構築されたAIモデルの幾つか(Llama 3やMistral等)をロード可能なので、2025年は、こうしたマルチモーダルAIをElixirで使っていく事例も増えていくと思います
Elixirにも、マルチモーダルAIを扱うための下記のようなライブラリが出現しています
b)テキスト以外のAIモデルも進化
LlamaやDALL-E、Stable Diffusion、Whisperのような、2023年には存在していたモデルとは異なるAIモデルが幾つも出てきました … 下記はその一部です
- DeepMind Gato 2
- OpenAI Viggo
- Mistral 2.0
- Llama 3.0
- Claude 4
- DeepMind Perceiver 2
2023年におけるAIモデル/プロダクトとの全体的な違いとしては、下記のような感じでしょうか
- モデルサイズの拡大
- 長文/長大データ処理可能
- マルチモーダル化
- 特化型モデルの出現
- モデルの軽量化/小型化
- リアルタイム性向上
- 巨大基礎モデルから小型専用モデルの生成
- 学習コスト低減とエネルギー効率化(省電力)
- スパースアクティベーション
- 知識蒸留
- モデルプルーニング
- LAMB
- AdaFactor
- 量子化
これらの実現には、昨年コラムで伸びると予測した「分散学習」と「フェデレーテッドラーニング」 が大いに関係しており、クラウドとエッジのハイブリッド学習などの技術も出現しています
こうしたエッジデバイス/エッジサーバー/クラウドを跨ぐ分散実行と、リアルタイム実行は、まさにElixirの主戦場なので、2025年は、2024年に構築された上記様々をElixir上で活用していくソリューションが期待できます
Elixirの分散/リアルタイム性については、AI・LLMとは別文脈の下記シリーズコラムでも触れています
c)RAGによる企業データ/専門知識の活用
RAG(Retrieval Augmented Generation)による企業内データや専門知識に基づくLLM活用が伸びた1年でもありました
RAG自体が何者かは、下記コラムを参照してください
従来のファインチューニングやプロンプトエンジニアリングと異なり、モデルが保有していない知識を外部データから簡単に注入できる気軽さと正確性の両立と、応用範囲の広さが、RAGが受け入れられた最大の要因です
2025年も引き続き、RAGによる企業内データと専門知識がミックスされたLLM活用は、業務やプロダクトに広まっていくことでしょう
私達も、今年からRAGによる企業内データ活用のソリューションを提供しています
Elixir/LivebookでのRAG利用は、下記コラムをご参考ください
d)リアルタイム分析AIとIoT連携
昨年コラムにて、「リアルタイム分析AI」が伸びてくる と予想しましたが、このカテゴリの伸びもそれなりにありました
その背景として、下記のような要因があります(幾つかは前述のまとめです)
- 特化型モデル:モデル軽量化/小型化、リアルタイム性向上、小型専用モデル生成
- スパースアクティベーション: モデルの必要な部分だけを活用
- フェデレーテッドラーニング:デバイス間でデータ共有し、ローカル学習
- デバイス/エッジ単独でのクラウドを使わないデータ処理
以下は、それらを土台とする、リアルタイム分析AIとIoT連携の活用事例です
- Siemens
-
MindSphere:産業用IoTプラットフォーム
- 製造設備の温度、圧力、振動、稼働時間をリアルタイム収集し、AI解析
- 故障やトラブルの予測と、それに対する計画的メンテナンスの実施
- 予知保全:ダウンタイム削減を実現
- IoTセンサーとエッジコンピュータも統合
- Smart Grid:電力網のデジタル化によるエネルギー需供の監視/最適化
-
Industrial Copilot:製造業のオートメーションとDXを推進するデジタルアシスタント
- IoTデバイス+AIによるスマートシティ交通管理(シンガポール、ロサンゼルス)
- 製品や設備のデジタルツイン化と仮想空間内でのシミュレーション
-
MindSphere:産業用IoTプラットフォーム
- Boschスマートファクトリー:工場内センサー/製品から自律思考するAI設備と遠隔保守
- Honeywell Forge:産業向けAIエージェント
- Waymo:AIによる人間よりも安全な自動運転タクシー
- Schneider Electric:持続可能AIデータセンター
- ABB Ability Genix:企業内データを活用するインテリジェント効率化プラットフォーム
-
Google Gboard:スマホ入力支援(予測単語、フレーズ)キーボードアプリ
- ユーザー入力をフェデレーテッドラーニングにより学習し、クラウドを使わず予測精度向上
- Apple Watch
- 各種ライフログをフェデレーテッドラーニングで学習し、異常な心拍やストレスレベルをクラウド無で通知
- Amazon Alexa
- 音声コマンドとセンサーデータをクラウド上でAI統合し、家電制御
私達も、このAI+IoTのカテゴリとして、下記のような宇宙分野(人工衛星、ローバー)や、地上におけるエッジコンピューティング(マンションオートロックIoTシステム提供)を2024年初頭から積極的に進めています
e)ノーコード/ローコード/RPA連携
昨年コラムにて、「RPA 3.0」のtoBへのインパクト にて触れていましたが、2024年にノーコード/ローコード/RPAとAIの連携は、下記のようなインパクトを与えました
- 生成AIとの統合が進み、高度な意思決定や自然言語処理が可能に
- リアルタイムデータに対するAI活用で迅速な意思決定支援も
- AIの恩恵で自動化対象が複雑なプロセスや未構造化データにまで拡大
- 個別ニーズに応じた自動化のパーソナライズが可能に
- コスト削減と効率化が進み、中小企業でも導入が増加
私達も、今年からノーコード/ローコード/RPA連携による業務システム改善/リプレイスソリューションを提供し始めました
生成AI連携が搭載されている代表的なプロダクトは、下記の通りです
- UIPath
- Zapier
- Microsoft Power Automate
- OutSystems
- Bubble
- Dify
- Livebook(Elixirによるローコードプロダクト)
特に、Jupyter Notebookを遥かに超える進化を見せたLivebookとAI・LLM系の連携は、ノーコード/ローコードの新たな未来を切り開き、新しい世代のプログラミングイディオムを生み出したと捉えています
その1つが、「Livebook Teams」です … 他ノーコード/ローコード同様、顧客チームと開発チームのITコラボレーションをもらたし、開発チームだけで無い開発可能性を生み出しました
また、KintoneとLivebookのデモを含むノーコード+生成AI+IoTハンズオンを私達も自治体向けに展開しました
②2025年、発展しそうなAI技術
下記のような技術にも注目が集まっており、2025年はこれらが非常に発展すると予想しています
α)AIエージェントとパーソナライズAI
- ユーザーの雑な指示からイイ感じによろしくしてくれるAIが今後、求められる
- ユーザーのニーズを予測し、プロアクティブにサポート
- ユーザーとのやり取りを通じて、自己学習するAI
- インタラクティブパーソナライゼーション
- マルチチャネルパーソナライゼーション
- フェデレーテッドラーニング等のプライバシー重視なパーソナライズ
Elixirにも、AIエージェント向けの下記のようなライブラリが出現しています
β)AIの透明性担保/説明可能AI(XAI:Explainable AI)
- AIが発展すればするほど、AIによる意思決定の不透明性が際立つため、大きな需要が生まれる
- 特に、リスクや責任の高い分野では、現行AIによる判断を妄信することは出来ない
- 倫理的な問題に対する人間側判断の余地を拡大したいと願う人も多い
- プライバシーの侵害など、AIがもらたす新たな社会問題についてもXAIが活躍しそう
γ)AIによるSDGs促進
-
EUのサステナビリティ報告指令(CSRD: Corporate Sustainability Reporting Directive)
- 2027年までに大手企業に対するCO2排出量の開示/報告義務化
- 2030年までに中小企業に対するCO2排出量の開示/報告義務化
- 中国のエコ・シビライゼーション
- フランスのフランス・エネルギー法
- これらを実現する土台としての DPP(デジタルプロダクトパスポート)
- それを支えるブロックチェーンの大規模化とコンピュータ計算速度向上
- DPPは関わらないが、アメリカのグリーン・ニュー・ディール等も生成AIと強い関わりがある
この中でも、「AIエージェント」は、Elixirが最も得意とする分散協調とノーコード+IoT連携の両立が重要となるカテゴリなので、2025年はElixirの真価に注目が集まる1年となりそうです
③世間はAI・LLMとどのように向き合っているか?
2023年頃に本格化した生成AIムーブメントは、70年間に渡る「AIに抱いた夢」が叶い始めたものであり、私も2022年末頃から、下記のような登壇スライドでその点をシェアしており、そこに至るまでに2度の冬を乗り越えて花開いた経過(と現代のAI・LLMで何が出来るのか)を紹介しています
しかし、その一方で、あまりに早く進んだように見えるムーブメントは、「飽き」や「失望」も早く訪れ、2024年中盤には、AI・LLMから皆の目線が離れたように見える部分もあったかと思われます
とは言え、コレはいわゆるハイプサイクルの「幻滅期」にあたり、「LLM」や「生成AIアシスタント」等はダウン傾向でプロットされていますが、これは技術が本物へと移行していくには避けて通れない道でもあり、その兆しが生まれたと受け取るのが妥当と考えます
なお、実際のAI・LLMの裏舞台は、実はそんな早い進化を遂げていないという真実があり、それは下記の昨年コラムでも述べています
また、電力問題などのAIがもたらした新たな社会課題(下記)に対しては、上述した「学習コスト低減とエネルギー効率化(省電力)」や「分散学習」、「フェデレーテッドラーニング」での対策も進んではいますが、依然、膨大な電力消費増大は続いており、根本的な解決に至っていないという見解です
ここに対しては、私達も「ElixirChip」という形で、非ノイマン型チップによる圧倒的な省電力(か性能向上)をもたらす研究開発を進めています
終わりに
AI・LLMの「今」と、そこに紐付くElixirの「現在」が伝わったでしょうか?
2025年は、Elixirの強みとAI・LLMに求められることが交わる最初の年となりそうで、非常にワクワクしています
私は今年、50歳を迎えましたが、昨年コラムで宣言した通り、楽しくてエキサイティングな学びやイベントの「本番」が始まっています(ついでにメイドアバターコスプレも進化しましたw)
次回は、「⑦2024年末までのElixirができることを振り返る」 をお送りします
p.s.このコラムが、面白かったり、役に立ったら…
明日は、 私で 「⑧2024年末までのElixirができることを振り返る」 です