llvm-mcaによる性能分析
はじめに CPUの性能について考える際には、命令数や IPC(Instructions Per Cycle) といった数値を着目しがちですが、実際の性能は命令間の依存関係、実行ユニット (ALU...
55 search resultsShowing 1~20 results
You need to log-in
はじめに CPUの性能について考える際には、命令数や IPC(Instructions Per Cycle) といった数値を着目しがちですが、実際の性能は命令間の依存関係、実行ユニット (ALU...
はじめに CGRA(Coarse-Grained Reconfigurable Array)は、ソフトウェアによって再構成可能なアーキテクチャであり、AI学習や汎用計算において 柔軟性と高効率化...
はじめに Raspberry Pi 5(Ubuntu OS)のファン動作温度をraspi-configで設定しました。 ファン制御の目的 CPUはトランジスタの動作によって発熱します。特に、大規...
リダクション演算がボトルネックになりやすい理由 リダクション演算 とは前のデータに依存する演算を指します。例えば以下の式、 sum = a[0] + a[1] + a[2] + ... + a[...
はじめに ・・だいぶ遅れてしまいましたが投稿します。 ArmアーキテクチャでのSIMD命令セットである、NEONとSVEについて、VLA設計の観点からまとめてみます。 自身の勉強も兼ねたテーマ設...
NEONとは ArmのSIMD(Single Instruction Multiple Data)拡張機能。 Arm社のページ1によると、以下の演算をサポートしている。 16x8ビット、8x16...
Clangではコンパイルオプションをconfigファイルから読み込むことができるそうなので、macOS環境で試してみました。 Clangのconfigファイルとは Clangのconfigファイ...
追記:コメントより設定ミスが分かったため、記事を改版しました。 以下をご参照ください。 https://qiita.com/joule/items/cc1f504414d81ce30e67 Py...
PGO(Profile-Guided Optimization)1はコンパイラにおけるフィードバック最適化の一つです。コードの実行時プロファイルをコンパイラにフィードバックして、リコンパイルする...
個人的に気になっているアセットの備忘録です。 前記事で触れている趣味の「街づくり」関連で調べています。 Forest Environment - Dynamic Nature 木や下層植物、岩な...
こんにちは。 今回はテンソルコンパイラのIREEについて、自己学習を兼ねて書いてみます。IREEはGoogleが開発したOSSのテンソルコンパイラです。LLVMを基盤としており、中間言語としてM...
Kokkos1の勉強をしています。本記事は"The Kokkos Lectures - module 2"2を参考にしています。 Tutorial Exercise 01 Kokkos Tuto...
Kokkosのビルド・インストール Kokkos1のビルド・インストールは、ドキュメントを参考にCMakeで行うことができます。以下の手順でUbuntuにインストールしました。 Document...
個人的な勉強メモです。 本記事は"The Kokkos Lectures - module 1"1および"Kokkos Core Wiki"2を参考にしています。 Kokkosとは 複数のベンダ...
Kokkos1の勉強をしています。本記事は"The Kokkos Lectures - module 2"2を参考にしています。 前記事ではコードに触れていなかったので、見ていきたいと思います。...
友人の@y-vectorfieldさんがDeepL API1を紹介してくれたので、TypeScriptでやってみました。 はじめにプロジェクトのセットアップをしていきます。npm, npxを使っ...
ネタ記事です。 Suburb Neighborhood House Pack 筆者はUnity素人ですが、3Dでリアルな街並みを作れないかなと "Suburb Neighborhood Hous...
Qiitanのグッズが欲しいので誰得記事を投稿しています。 bashではbuilt-inのcompgenというコマンドがあるそうで、コマンドのリストを返してくれます。 compgen -c: 実...
個人的な学習メモです。 Calling Conventions1 関数やcall、invokeは呼び出しにあたってオプショナルの呼び出し規約(calling convension)を指定すること...
個人的な学習メモです。 LLVM IRとは1 LLVMコンパイラにおける中間表現(intermediate representation)である。コンパイラの汎用最適化で扱うコードであり、高水準...
55 search resultsShowing 1~20 results
Qiita is a knowledge sharing service for engineers.