この記事は、Elixir Advent Calendar 2025 その1 の25日目です
昨日は私で 「ElixirChipの鼓動④ ノイマン型の闇(性能劣化、消費電力増大)は解決できる ~君は高速分散データ処理とエッジコンピューティングの未来を見る」 でした
Merry Xmas!![]()
![]()
piacere です、ご覧いただいてありがとございます ![]()
前回 は、「AIとコンピューティングの7つの課題」を明らかにし、「現代CPU/GPUのアーキテクチャと、その上のNW、OSが、HW性能を損なっている」という点について共有しました
そうしたノイマン型の闇(性能劣化、消費電力増大)を、ElixirChipがどのように解決できるかも示しました
今回は、そんなElixirChipが「AIとコンピューティングの7つの課題」をどのように解決していき、ElixirChipが叶える世界を見つつ、その先に叶う「人とローカルAIの連携」についてお話します
前回同様、2,000名近くがライブ配信を見てくださった「Qiita Conference 2025 Autumn」 の登壇が土台となります
「今のコンピュータ、AIにもWebにも向いていないので作り直そう!!」

YouTubeライブ配信アーカイブが下記で見れます(私の登壇から始まるようタイムライン設定済)
世界的に著名な凄腕エンジニア/AIエンジニアが並ぶ中でもアンケートトップ評価をいただけたようです … ありがとございます ![]()
なお、私はコンピューティングとデータ処理、並行分散ソフトウェア/OS開発、SaaS事業経営の専門家ではありますが、CPU開発および宇宙開発に特化した専門家ではありません
また、科学コミュニティを主催してはいますが、アカデミックな面で上記を専攻していない「野良科学者」のため、各分野にご興味高い方や造形深い方、現業で有識な方とディスカッションしたり、ご教授いただけたら嬉しいです
あと、このコラムが、面白かったり、役に立ったら、
をお願いします ![]()
Elixirアドベントカレンダー、応援お願いします
今年もやっています
v)ElixirChipはどのように7つの課題を解決するか?
前回お伝えしたElixirChipの性能面/消費電力面の改善 をもって、「AIとコンピュータの7つの課題」がどのように解決されていくかを見ていきましょう
解決①:FPGA版ElixirChipは生成AIにマッチ
まずElixirChipは、生成AIがGPU向きで無いところを大幅に緩和します
主に「メモリ転送の最適化」と「HWパイプライン化」で叶えます
メモリ転送の最適化は、高速なメモリ上に必要なデータが常時オンチップで高速アクセスできるように、大きなメモリから必要な分をストリームプリフェッチすることで実現します
ストリームプリフェッチは、FPGAも得意な領域ですが、Elixirも非常に得意とする領域であり、無作為にプログラミング言語を選定してしまった場合には決して得られない優位性です
たとえばVersal HBMであれば、下記トークン数に応じて、速度/量の異なるメモリ間をストリームプリフェッチすることで、高速なBRAM/UltraRAM上にオンチップ化します
- ~400トークン: メモリ転送を行わない
- BRAM/UltraRAM上にオンチップ化
- ~8,000トークン: HBMプリフェッチ
- HBM → BRAM/UltraRAMにストリームプリフェッチでオンチップ化
- それ以上:DDRプリフェッチ
- DDR → HBM → BRAM/UltraRAMにストリームプリフェッチ
Multi-head/トークン依存/MoEのような依存構造は、HWパイプライン化で演算を独立させ、結果を集約すれば分岐待機を緩和できます
Multi-headとMoEで頻発するキャッシュ競合も、イミュータブルなElixirなら根本から無くせます
ランダムアクセスは、Q/K/VをHBMからBRAM/UltraRAMにストリームプリフェッチ/オンチップ化することで高速化できます
学習時固有の問題点のうち、HBM帯域不足も、「メモリ転送の最適化」で帯域依存を緩和できます
小型処理GPU占有と小バッチについては、そもそもFPGAはGPUとは違い、チマチマした小型処理に強いチップです
NW速度制約も、「メモリ転送の最適化」の応用でストリーム化しつつ、課題④のNW速度向上とセットで爆速化できます
推論時固有の問題点のうち、小バッチ/少トークンも、バッチ単位/トークン単位に最適化されたHWパイプライン化と、小型処理に強いFPGAで解消できます
過剰パーツ消費電力は、GPUとは異なり、未使用ブロックを個別に停止 or 省電力化できるFPGAの得意技です
量子化とリアルタイム処理も、GPUでは特殊なアクセラレータが無ければ実現できませんが、FPGAであれば最も得意とする領域です
そもそもGPUは、特有のカーネル切替/分岐・小規模演算待機が足を引っ張っており、そうした足枷が無いFPGAは根本的に生成AI向きと言えます
また、Attention/FFN/Embedding全体を並列パイプライン化し、高速化する余地もあります
これらのことから、GPUでは生成AI実行時に60%のスローダウン要因と無駄が多発しているところ、FPGA版ElixirChipは、推論性能20倍/省電力70%と、学習性能8倍/省電力60%を同時に叶えます
解決②:非ノイマン化でVNB大幅緩和
Elixirを土台に、非ノイマン型アーキテクチャに移行することで、VNBを大幅に無くし、根本解決できます
ちょっと特許に触れるため、詳しく述べれませんが、1命令1メモリアクセスとせず、高速なLUT(/BRAM/UltraRAM)の積極利用で、遅いメモリ(DDR/HBM)へのアクセスを極力、行わないように制御します
このスライドで言うと、ピンクの矢印がごっそり無くなるイメージです
また、Elixirのデータフロー記述やマルチプロセス記述をそのままFPGAのHWパイプラインへと並列化マッピングできるので、ここも無作為にプログラミング言語を選定したら得られない優位性です
分岐待機なども、先ほどの生成AI同様、HWパイプラインで独立化したり、ストリームプリフェッチすることで、極力待機させない構造にできます
解決③:電力/排熱増加無で高性能化を実現
ElixirChipは、電力/排熱増加無で高性能化を実現できます
性能がほぼ同等のXeon Gold 6442Yとの比較で、98.6%も消費電力を削減でき、排熱もほぼ無いため、冷却設備が不要で、性能向上に伴う排熱増大と冷却負荷増大による消費電力増大が起きません
この状態で、ElixirChipの台数増加での性能向上が図れるので、電力によって高性能化を果たす構造では無くなっています … これにより、特殊な電源設備への投資も不要です
更に、CPUは1Uあたり1、2枚が上限ですが、KR260 ElixirChipは4から8枚収容でき、敷地あたり性能は2から8倍にできます
これら特性を活かして、ElixirChip2,000台でデータセンターを構築した場合、Xeon Gold2,000台と比べ、4年償却で38倍のコスト圧縮が可能で、PUEも1.05が出せます
解決④:NW処理後半のVNB除去で全解決
ElixirChipは、SmartNICやDPU等では叶えられないNWパケット処理後半のVNBも除去できます
具体的には、パケットをNICからFPGAロジックにダイレクトに渡し、OSを介さずTCP/IPをアプリとセットでFPGA化します
つまり、現行のようなOSレイヤーを無くす … ということです
TCP/IPスタックもElixir製ですが、Elixirの高速かつ高品質なコード記述が可能な点と、ステートマシンを作るのに長けている点によって実現しており、ここも無作為にプログラミング言語を選定したら得られない優位性です
これだけでも性能を10倍upできてNW帯域を活かせますが、さらにNICからDMA/メモリを介さずFPGAに直接ストリーミングすれば、より高速化も可能です
更に、光トランシーバ標準搭載のVersal HBMなら、光回線とセットで「真のフォトニクス」ができ、40倍程度まで引き上げれるでしょう
後述する「分散データセンター」や「真のデジタルツイン」は、このNW処理のVNB除去を前提として、現状の構成では不可能な構築を実現します
解決⑤:マルチコア前提の言語Elixirを採用
シングルコア前提の言語が起こす弊害も、Elixirを採用した時点で、下記スライドの通り、分散/並列化に適したフィーチャが乗り、自ずと解消されます
Elixirを採用することで、上記スライドのような、大量ユーザー/データ向けの優位性と言語仕様がHW化に上乗せされるので、ここでも無作為にプログラミング言語を選定した訳では無い点が強調されます
中でも、「プロセスレベルのスケーラビリティ/分散」や「クラウド無でもスケールアウト/イン/仮想化可能」は、下記コラムで見ることが出来ます
また、「チーム開発向き」についても、下記コラムで触れています
解決⑥+⑦:ASIC/SoCとFPGAをElixirで開発
ElixirChipは、ElixirからASIC/SoCとFPGAがビルドできます
これにより、従来の非ノイマン型コンピュータやASIC/SoC、FPGAにあった、特化DSLやHW知識というハードルが無くなり、普通のWeb/IoT/AIプログラマがHW開発可能になるということです
なお、HW版ErlangVMもあるため、既存のErlang/Elixir資産も動かせる点もポイントです
普通にプログラミングすれば良いだけなので、レイヤー4以上NW機器のHW開発もペイできるでしょう
ⅴ)ElixirChipとして何をリリースし、解決してゆくか?
直近のリリースラインナップ
具体的なラインナップとしては、まずKR260 FPGA版ElixirChipでのWebサーバー実装を最初にリリースし、某データセンターにテスト配備予定ですが、FPGA製Webサーバーは滅多に見ないので、象徴的なケースになるでしょう
その後は、APIゲートウェイ/IoTゲートウェイや認証サーバー、動画配信サーバー等のアプリケーションサーバー群とVersal HBM生成AIエンジンが高いニーズと改善効果の両面があると捉え、Webサーバーの外側に足を伸ばしていきます
また、レイヤー4以上のNW機器群(ロードバランサー、ファイアウォール、CDN)等も有望なターゲットです
「魔法級の実装」を叶えるASIC/SoC版ElixirChip
上記FPGA版ElixirChipでの有用性/ユースケースを幾つか検証した後、ASIC/SoC版ElixirChipの製造検討に入ろうと思いますが、ASIC/SoC版ElixirChipは消費電力を95~99%削減できるので、
「2050年の電力不足も、ASIC/SoC版ElixirChipなら片付けられそう」
と言う凄まじいレベルです
それだけで無く、性能向上も50~800倍向上と凄まじいので、
「現在コンピューティングでは不可能な、魔法級の実装」
すら叶えてしまいます
そんなASIC/SoC版ElixirChipが叶える世界観を一緒に見ていきましょう
α)「異次元級デバイス」の製造
4.2年、充電が不要なスマホとか、100日以上、飛び続けられるドローンのような「異次元級デバイス」が実装可能となります
上記2つの効果は、18万台の自動車をEV化するか、発電所を5基削減する効果に相当します … これを社会全体のデバイスや電力利用に展開したら、一体どうなるでしょう?
恐らく、電力が制約していた社会課題は、軒並み解決可能となり、ASIC/SoC版ElixirChipは社会構造そのものを変えてしまうインパクトでしょう
β)ハイパースケールDCを超える「リミットレスDC」の建造
PUE1.005から1.01なのに、ハイパースケールデータセンター以上にスケーラビリティ高い「リミットレスデータセンター」が作れるようになります
このDCは更に、電力依存も無くし、資源国/電力コスト高騰国のハンディが消失することから、国家を跨ぐ社会構造変革が可能です
また、脱炭素/カーボンニュートラルを超えた、「ゼロヒート」産業を出現させることにもなります
β)誰もが「AIによる超知能」を携帯する「究極のローカルLLM」
スマホやエッジデバイス/IoTで、常時ローカルLLMを常駐させ、動作させても、余裕でバッテリーが保つように出来ます
これにより、クラウド接続不要で即時応答する生成AIが利用可能になり、都市/農村/陸海空を選ばず、全ての環境で「AIによる超知能」を誰もが携帯している状態なので、
「究極のローカルLLMによる、人類とAIが密結合する世界」
という近未来的な進化の前触れと言えるでしょう
γ)現在より40倍も長持ちするリモートエッジによる自律運用
太陽光発電が断絶しても、416日間アクティブモードで保つ人工衛星も作れます
従来は、10日程度しか保たないので、凄まじい運用性とユーティリティがもたらされます
同様の技術により、100V電源を必要とせず、年1回のバッテリー交換で動作する防災設備や、給電を数十年レベルで必要としない軽量IoTデバイス/エッジデバイス等も実現可能でしょう
Δ)もはやデータセンターは不要 … 「分散データセンター」
NW処理のVNBを除去できることで、光回線無しの既存メタル回線でも、帯域を目一杯使い切れるので、広大な敷地でのデータセンター建造が不要な「分散データセンター」をオフィス群や雑居ビル群で作れてしまいます
この形態の最大のメリットは、敷地面積に縛られず、数や地理的近接の配置、役割分担によって、全体としてデータセンターでは不可能なレベルのスケーラビリティを構築できる点と、近接コンピューティング群によるリアルタイム性能の最大化にあります
このコンセプトを私は勝手に「ネイバーフッドコンピューティング」と呼んでおり、本コラムシリーズの1作目である下記で掲げています
加えて、冷却設備/電源設備/広大な敷地の全てが不要なので、住民反対運動で荒れているデータセンター問題も解消できます
ε)スパコン級のマシンを構築できる分散環境
基本性能が、2025年時点の最高速スパコン、実行性能1.7exaFLOPSの「El Capitan」に搭載されるEPYC 9004とバトれるということは、スパコン級のマシンも作れることを意味します
ASIC/SoC版ElixirChipは、El Capitan搭載のEPYC 9004より敷地あたり性能2.6倍が出せ、冷却/電源設備 (大規模液冷直結、三相高電圧入力+PDU) のコストも削れ、4.8exaFLOPSもの計算速度を叩き出せる可能性があるかも知れません
ζ)通信途絶下でも稼働するエッジリアルタイムAI
クラウドまでの通信路がオフラインになっても、エッジデバイスとエッジサーバーの間で、現在のChatGPTやGeminiのようなオープン型LLMクラスの大規模AIも稼働可能なので、通信途絶下でも利便性が損なわれません
また、エッジデバイスとエッジサーバーで動かすのは、実質、ローカルLLMなので、オープン型LLMでは不可能な情報・ノウハウ流出リスク回避やセキュリティリスク回避、クラウド課金削減、自社特化カスタマイズ等が促進されます
この促進は、下記のような「企業でAI利用が進まない」現象に対するカウンターにもなる可能性が高いです
さらに、エッジ分散が進めば、下記のような業務改革も叶います
ⅵ)エッジ × 分散生成AIで変わってゆく産業
エッジ × 分散生成AIが進むと、AIが人を代替するどころか、むしろ人とAIがキチンと役割分担を果たし、今とは比べものにならない位、協力し合う社会が生まれると私は想定しています
これらスライドに示した通り、今の人間社会は、人同士/現場同士が助け合ったり、連携したり、知見を共有することが上手く出来ていません
また、全社最適のようなプアな方式でしか統制が取れなかったり、通り一辺倒なROIでしか投資効果や事業効果が評価出来ない、お粗末な状態とも言えるでしょう
それを適正化/正常化していくのが、エッジ × 分散生成AIであり、それを適正な性能/省電量/NW帯域活用で下支えするのがElixirChipです
下記3つの例は、エッジ × 分散生成AIを活用することで生まれる、新たな医療/介護、自治体防災、後継者問題の解決を示したものですが、ドメインの部分や、業務の部分を、より身近な仕事や産業に置き換えてイメージすると、様々な改善パターンを生み出すことができます … ぜひご自身の業務に当てはめて想像してみてください
ⅶ)それでも残る課題 … AIに依存する「人の愚かさ」
たとえASIC/SoC版ElixirChipを用いたとしても、解決できないであろう課題が、実は2点あります
①AIスロップ … AI不要な処理をAI処理する愚行
「1+1」のような単純計算や、要約するまでの無い文章の要約のような、AIを使うまでも無い低消費電力の処理にAIが使われ、データセンターの処理量が圧迫される現象 … それが「AIスロップ」です
個人はラクをしたい/企業は金儲けをしたいが故に、こうしたムダなAI利用を控えない可能性が高いのですが、データセンターが圧迫されれば、AI提供企業は利用制限や課金を強いてくるため、今ほど気軽にAIを使えなくなるでしょう
しかし、本当に怖いのは、気付いたらAI以外の電力利用をAI利用が圧迫しており、電力不足による停電で生活のために電気が使えなくなっていた … と言う、便利なハズのAIが、AI以外の不便を強いるという本末転倒な展開です
ASIC/SoC版ElixirChipだけでは、その寿命を相当延長は出来ますが、根本解決は果たせません
これに対する有効な打ち手は、ローカルLLMです
データセンター無でも動くローカルLLMは、データセンターやNWが止まっていても使えるし、AIスロップで無駄遣いをしても困るのは自分自身なので、ある種、自身でそのウェイトを自制・自粛できます
また、今からでもローカルLLMを利用し始めれば、今後起こるデータセンター圧迫も軽減できます
②ワークスロップ … AIが社会の生産性をむしろ下げる
AIが出した結果のチェックを手抜きした人が、不正確なデータや成果物を蔓延させ、そのチェックや修正を行う人の生産性が下がり、手抜きした人へのイライラや不信が募り、組織全体/社会全体の生産性が下がってしまう現象 … それが「ワークスロップ」です
AIを使うことで生産性が上がるどころか、むしろ下がってしまい、しかもムダなAI利用による電力消費増大も招いてしまうこの問題ですが、すでに大きな社会問題となり始めています
中でも、若者は「AIが正しい」と言う思い込みが激しく、AIのメカニズムも把握せずに妄信する傾向が高いので、悪化が加速しやすいという傾向もあります
ASIC/SoC版ElixirChipがどれだけ性能向上しても、この問題の解決には全く貢献しません
これに対する有効な打ち手も、やはりローカルLLMです
RAGやプロンプトチューニングの内臓、ファインチューニングやRoLA等で自社特化したローカルLLMを磨くことで、人がたとえチェックを手抜きしたとしても大幅なミスを出さない/出しにくいAI利用へと改めることが出来ます
80年前の威光に縋らず私達自身で未来を掴む
普段、当たり前に使っているコンピュータに、こうした「闇」が数多くあることが、ご理解いただけたでしょうか?
その元となるノイマン型アーキテクチャを、フォン・ノイマンが着想したのは1945年 … 今から80年も前のことです
そこからの80年間は、この大昔のアイデアが通用する「奇跡」や「偶然」を謳歌してきました … が、私達はその結果、80年に渡る「呪い」にかかってしまった訳です
現代CPU/GPUやNW、OS、Web、AIは、この大昔のアイデアに依存し過ぎており、それ故、HWの本来性能は出せず、人類の発展は行き詰まった … と私は感じています
この80年前のアイデアは、生成AIや人類の行動データが生む「私達の未来」を到底、支え切れるものでは無いと実感しています
私達は、そろそろ見直すべきです
つまり、80年前の威光にすがらず、私達自身で未来を築くことが重要だと思います
終わりに … ElixirChipを気軽に「現場」に置いてみよう
ElixirChipを気軽に「現場」に置ける、通信断でも止まらない「GENBAサーバー」と言うものを作ってみました
これは、クラウドだけだと少し困る場面(通信断、速度、個人情報やノウハウ等の外に出したくないデータ、設置制約など)をその場でカバーするための「すごく小さいけど高性能/省電力でセキュリティに優れたサーバー」です
あらゆるコンピューティングを「現場で完結」させられ、「クラウドに依存しない」ような使い方が出来るので、工場や医療/介護、防災、金融/保険、労務/給与管理等といったシーンで威力を発揮します
ElixirChipの高性能/省電力に加え、低発熱で静音、100Vで動作し、ローカルLLMも使えるので、今回コラムの内容を全て実践できます
Elixirでプログラミング可能なので、HW記述言語や特化DSLを覚えなくてもお手元の業務システムを容易にHW化、出来ます
大規模処理をクラウドに分担させ、即時処理は手元のGENBAサーバーや、複数台のGENBAサーバークラスタで賄うと言った分散も、Elixir同様に得意技です
Elixirが出来ることの多く1と、既存Elixir/Erlang資産の利用が出来ます
カメラの横にちょこんと置けるような「手のひらサイズ」のバージョンも、今後ラインナップ予定です
バッテリー駆動によるリモートエッジ化も、近々検討予定です
もしGENBAサーバーやElixirChipが気になったら、下記XのDMにご連絡ください … 世の中に無い、面白そうなものを一緒に作りましょう
p.s.このコラムが、面白かったり、役に立ったら…
-
NIF/BIFは現在サポート外だが、将来的にRISC-V化対応で実行できる予定 ↩



























