LoginSignup
6
2

More than 1 year has passed since last update.

【iOS】Metal Best Practicesの解説(3) リソースオプション

Last updated at Posted at 2021-06-15

Metal Best Practicesは、iOS/MacOS/tvOSのAPIであるMetalを用いた設計のベストプラクティスガイドです。

本稿では、何回かに分けてこのガイドを読み解き、コード上での実験を交えて解説していきます。
読んでそのまま理解できそうなところは飛ばしますので、原文を読みながら原文のガイドとしてご利用下さい。
また、iOSの記事なので他のOS(MacOS, tvOS)についての記載は割愛します。

他の記事の一覧は、初回記事より参照下さい。

Resource Options (リソースオプション)

ベストプラクティス:適切なリソースストレージモードとテクスチャ使用オプションを設定します。

リソースストレージモードについて

iOS, tvOSの場合は次の2種類があります。このように、CPUとGPUがメモリを共有するモデルをユニファイドメモリモデルといいます。

モード 説明
Shared モード CPU と GPU の両方にアクセス可能
Private モード GPU のみにアクセス可能

【iOS, tvOSのリソースストレージモードの概要図】

そして、iOSにおけるリソースストレージモードの選択は、通常はSharedモードが正しい選択であるとのこと。プライベートモードは、CPU がリソースにアクセスしない場合にのみ選択する。

適切なテクスチャ使用フラグの設定

Metalは、その使用目的に基づいて、特定のテクスチャのGPU操作をできる。事前に知っている場合は、必ず明示的なテクスチャ使用オプションを宣言します。

Unknownオプションに依存しないこと。このオプションはテクスチャに最も柔軟性を提供するが、かなりのパフォーマンスコストが発生します。

コードで検証してみる

テクスチャの使用フラグの設定によってどの程度パフォーマンスに違いが出るのか検証してみます。
こちらのリポジトリにサンプルコードがあります。

サンプルコードの中に、Particleというサンプルがあるのでこれを改変しながら計測していきます。

(実行イメージ)

テクスチャの使用フラグを設定する箇所の抜粋です。コメントにあるとおり、texDesc.usageの設定をUnknownとする場合と明示的に指定する場合の両方を用意し、実行するときに片方をコメントアウトしながら計測します。

ParticleMetalView.swift
func initTexture() {
    func makeRenderTexture() -> MTLTexture {
        let texDesc = MTLTextureDescriptor()
        texDesc.width =  100//(parent.mtkView.currentDrawable?.texture.width)!
        texDesc.height =  100//(parent.mtkView.currentDrawable?.texture.height)!
        texDesc.depth = 1
        texDesc.textureType = MTLTextureType.type2D

        texDesc.storageMode = .private
        texDesc.pixelFormat = .bgra8Unorm

        texDesc.usage = .unknown // Unknown版
        texDesc.usage = [MTLTextureUsage.renderTarget, MTLTextureUsage.shaderRead] // 明示指定版

        return metalDevice.makeTexture(descriptor: texDesc)!
    }
    texture = makeRenderTexture()
}

計測は、Metal System Traceを使います。使い方はこちらをご覧ください。

アプリを実行し、一定時間計測してから、GPUのサマリーでFragmentとVertexの所要時間を見てみましょう。

<Unknown版の結果>

image.png

<明示指定版の結果>

image.png

「Avg CPU to GPU Latency」を見てください。VertexはなぜかUnknown版の方が早いですが、Fragmentは明示指定版の方が、1ms近くなっています。トータルでも明示指定版の方が0.77ms早い結果となりました。

設定を1つ変えるだけで1msも早くなるのなら、労力に対して結構いい感じの成果なんじゃないでしょうか😄

結論

ベストプラクティスにあるとおり、テクスチャ使用フラグを明示するほうが効率的ということがわかりました。

最後に

iOSを使ったARやML、音声処理などの作品やサンプル、技術情報を発信しています。
作品ができたらTwitterで発信していきますのでフォローをお願いします🙏

Twitterは作品や記事のリンクを貼っています。
https://twitter.com/jugemjugemjugem

Qiitaは、iOS開発、とくにARや機械学習、グラフィックス処理、音声処理について発信しています。
https://qiita.com/TokyoYoshida

Noteでは、連載記事を書いています。
https://note.com/tokyoyoshida

Zennは機械学習が多めです。
https://zenn.dev/tokyoyoshida

6
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
2