Raspberry Pi 5でCPUファンの冷却性能を評価するための備忘録
はじめに 師匠(友人)から「2種類のCPUファンの性能差を客観的に評価したい」と依頼を受けました。 「なんとなく冷えそう」ではなく、CPU温度や動作周波数といった指標を用いて比較する方法を検討し...
59 search resultsShowing 1~20 results
You need to log-in
はじめに 師匠(友人)から「2種類のCPUファンの性能差を客観的に評価したい」と依頼を受けました。 「なんとなく冷えそう」ではなく、CPU温度や動作周波数といった指標を用いて比較する方法を検討し...
はじめに 近年の AI コンパイラでは、行列積 (MatMul) は最も重要な演算の一つです。 MLIR では MatMul を linalg.matmul として表現できますが、最終的には S...
はじめに LLM 推論において、Attention は計算コストとメモリアクセスの両面で大きな割合を占める処理です。特に、長いトークンを扱う場合、Attention の効率は推論性能全体に大きく...
リダクション演算がボトルネックになりやすい理由 リダクション演算 とは前のデータに依存する演算を指します。例えば以下の式、 sum = a[0] + a[1] + a[2] + ... + a[...
はじめに LLM推論の高速化において、FlashAttentionは広く用いられる重要な最適化手法の一つとなっています。一般に「IO-awareな設計によってメモリアクセスを削減し、softma...
はじめに CPUの性能について考える際には、命令数や IPC(Instructions Per Cycle) といった数値を着目しがちですが、実際の性能は命令間の依存関係、実行ユニット (ALU...
はじめに CGRA(Coarse-Grained Reconfigurable Array)は、ソフトウェアによって再構成可能なアーキテクチャであり、AI学習や汎用計算において 柔軟性と高効率化...
はじめに Raspberry Pi 5(Ubuntu OS)のファン動作温度をraspi-configで設定しました。 ファン制御の目的 CPUはトランジスタの動作によって発熱します。特に、大規...
はじめに ・・だいぶ遅れてしまいましたが投稿します。 ArmアーキテクチャでのSIMD命令セットである、NEONとSVEについて、VLA設計の観点からまとめてみます。 自身の勉強も兼ねたテーマ設...
NEONとは ArmのSIMD(Single Instruction Multiple Data)拡張機能。 Arm社のページ1によると、以下の演算をサポートしている。 16x8ビット、8x16...
Clangではコンパイルオプションをconfigファイルから読み込むことができるそうなので、macOS環境で試してみました。 Clangのconfigファイルとは Clangのconfigファイ...
追記:コメントより設定ミスが分かったため、記事を改版しました。 以下をご参照ください。 https://qiita.com/joule/items/cc1f504414d81ce30e67 Py...
PGO(Profile-Guided Optimization)1はコンパイラにおけるフィードバック最適化の一つです。コードの実行時プロファイルをコンパイラにフィードバックして、リコンパイルする...
個人的に気になっているアセットの備忘録です。 前記事で触れている趣味の「街づくり」関連で調べています。 Forest Environment - Dynamic Nature 木や下層植物、岩な...
こんにちは。 今回はテンソルコンパイラのIREEについて、自己学習を兼ねて書いてみます。IREEはGoogleが開発したOSSのテンソルコンパイラです。LLVMを基盤としており、中間言語としてM...
Kokkos1の勉強をしています。本記事は"The Kokkos Lectures - module 2"2を参考にしています。 Tutorial Exercise 01 Kokkos Tuto...
Kokkosのビルド・インストール Kokkos1のビルド・インストールは、ドキュメントを参考にCMakeで行うことができます。以下の手順でUbuntuにインストールしました。 Document...
個人的な勉強メモです。 本記事は"The Kokkos Lectures - module 1"1および"Kokkos Core Wiki"2を参考にしています。 Kokkosとは 複数のベンダ...
Kokkos1の勉強をしています。本記事は"The Kokkos Lectures - module 2"2を参考にしています。 前記事ではコードに触れていなかったので、見ていきたいと思います。...
友人の@y-vectorfieldさんがDeepL API1を紹介してくれたので、TypeScriptでやってみました。 はじめにプロジェクトのセットアップをしていきます。npm, npxを使っ...
59 search resultsShowing 1~20 results
Qiita is a knowledge sharing service for engineers.