10
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

AIエッジコンテスト(実装コンテスト)のチュートリアル【9: HW合成してビットストリームを生成するまで】

Last updated at Posted at 2020-03-19

ようやくハードウェアを合成する準備が整いました。FPGAで実現する回路を合成して実機動作の準備をしましょう。

FPGAとビットストリーム

スクリーンショット 2020-03-19 22.32.20.png
今回の実装ターゲットはZynq FPGAといい、ARMプロセッサが内蔵された特殊なFPGAです。FPGAの構成要素は上の図をみてください。基本素子であるLUT、BRAM,DSPブロック、そして柔軟な配線を実現するためのChannel,Switch Block, IO Blockで構成されています。
スクリーンショット 2020-03-19 22.32.30.png
その中身ですが、LUTの出力値、すなわち小規模メモリの内容を書き換えることで任意の論理回路を実現できます。
スクリーンショット 2020-03-19 22.34.25.png
配線は交差する部分とLUTブロックなどの接続にトランジスタスイッチを使って実現しており、スイッチのON/OFFを1ビットの情報に入れておきて書き換えできるようにします。つまり、FPGAの構成要素は大小のメモリでできているため、その情報をストリームに流し込むビットの列=ビットストリームでユーザの回路情報を保持しているんですね。
FPGAの回路合成=ビットストリーム生成です。それでは、Vivadoツールを使ってHLSで合成した回路をビットストリームに合成しましょう。
スクリーンショット 2020-03-19 22.36.42.png

Vivadoを使ったビットストリームの生成、、の前に

Vivadoで合成する前に、もう一度流れを確認しましょう。実現したい回路(今回は畳み込み演算)のC++記述をHLSツールで合成して論理回路を合成します。論理回路はゲートレベルの記述になっており、通常はハードウェア記述言語(Verilog HDL/VHDL)で記述します。これを入力としてビットストリームに変換するツールが今から使うVivadoというツールです。

Vivadoを起動する前にVivado HLSを再度起動して、前回までのプロジェクトを開いてください。まず、HLSで合成したHDLファイルをインポートします。スクリーンショット 2020-03-19 22.39.59.png
Solution -> Export RTL を選択しそのままOKをクリックします。しばらくするとexportが終わります。いよいよVivadoを起動しましょう。

スクリーンショット 2020-03-19 22.41.09.png

Vivadoを使ったビットストリーム合成前の準備

起動したらプロジェクトを生成して設定します。Create a New Vivado Project -> Next, Project Name -> “pynq_ultra96_conv_l0_1”としNext,Project Type -> RTL Project をチェックしNext, Add Sources, Add Constraints は共に Nextを指定。
スクリーンショット 2020-03-19 22.42.09.png
Default Part で上図のように、Ultra96V2ボードを選択し、Next, New Project Summary で Finishを選択.
スクリーンショット 2020-03-19 22.42.45.png
Create Block Design -> OK を行うと
スクリーンショット 2020-03-19 22.44.22.png
Diagramが開いてIPコアベースの設計が可能となる。
そこで、右クリックしてAdd IP を選択
スクリーンショット 2020-03-19 22.45.27.png
Searchでzynqと入力するとZynq UltraScale+ MPSoCが選べるのでダブルクリックするとスクリーンショット 2020-03-19 22.46.13.png
ZYNQのブロックが挿入されます。Ultra96V2用の設定を読み込みましょう。
Run Block Automation をクリックしてOK. これでUltra96V2ボードに搭載されているARMプロセッサのデフォルト設定が読み込まれて設定されます。

スクリーンショット 2020-03-19 22.48.27.png

次にユーザが設計したIPコアをどのバスで接続するのかを指定します。
zynq_ultra_ps_e_0 をダブルクリックして, PS-PL Configuration -> Slave Interface
-> AXI HP -> AXI HP0 FPD にチェックを入れてOKをクリック。これでAXI HPポートを使う準備が整いました。次はユーザのIPをインポートしましょう。
スクリーンショット 2020-03-19 22.50.59.png
ちょっと面倒な操作が続くので図でまとめました。上図をみてその通りに設定してください。そうするとHLSで設計したトップ関数(今回はKernel)がIPコアとして読み込まれる。IP > Repositoryに戻るのでOKをクリック.
スクリーンショット 2020-03-19 22.52.36.png
Diagramの空白部分を右クリックして Add IP -> Search にKernel と入力すると自作IPコアが現れるのでダブルクリック(上図左). 自作IPコアが取り込まれました!(上図右)

最後に、DMAコアを追加しましょう。

スクリーンショット 2020-03-19 22.53.52.png
Diagramの空白部分を右クリックして Add IP -> Search にDMAと入力し、
AXI Direct Memory Access をダブルクリック.
スクリーンショット 2020-03-19 22.54.30.png
axi_dma_0をダブルクリックして Enable Scatter Gather Engineのチェックを外し Width of Buffer Length Register を 26bit に設定してOKをクリック.26ビットというのはDMAを使って転送するデータのサイズを指定するビット長です。つまり2の26乗個のデータを転送できるように設定しました。なぜデフォが14ビットなのか意味不明です。。。

IPコアを接続しましょう。

スクリーンショット 2020-03-19 22.56.24.png
kernel_0 と axi_dma_0 の stream_in <-> M_AXIS_MM2S, stream_out <-> S_AXIS_S2MMをドラッグアンドドロップで接続し, Run Connection Automationをクリックしてください。

スクリーンショット 2020-03-19 22.57.22.png
All AutomationをチェックしてOKをクリックすると接続用のIPコアが自動で設定され、配線が行われます。スクリーンショット 2020-03-19 22.58.26.png
再度 Run Connection Automation をクリックしそのままOKをクリック.

すると配線が自動で行われます。このままでも良いのですが、みやすいように再配置しましょう。

スクリーンショット 2020-03-19 22.59.59.png

最後に、配線が正しく行われているかチェックをしましょう。DRC (Design Rule Check)といいます。
スクリーンショット 2020-03-19 23.00.44.png
空白部を右クリックし Validate Design を選択して接続のチェックをしましょう。
(Warningが出るが気にしない。。)

ビットストリーム生成

この時点で回路構成ができていますが、肝心のHDLファイルはまだ生成されていません。そこで、各IPコアのHDLファイルを生成しましょう。スクリーンショット 2020-03-19 23.02.10.png
BLOCK DESIGNにあるSources タブに切り替えて design_1 を右クリックしてGenerate Output Productsを選択し, Generate をクリックしてしばらく待ちます。
スクリーンショット 2020-03-19 23.02.59.png
再度design_1 を右クリックしてCreate HDL Wrapperを選択し, OK をクリック.この作業はトップHDLファイルといって、回路全体を接続する記述が書かれたファイルを生成しています。
スクリーンショット 2020-03-19 23.04.02.png
Flow Navigator -> Generate Bitstreamをクリックして適時 OK をクリックしましょう。いよいよビットストリームを生成する作業が始まります。論理合成→リソース配置・配線、が行われます。この作業は10〜20分かかるのでコーヒーでも飲んで待ちましょう。ソフトウェアだったらコンパイルすると一瞬ですよね。ハードウェア設計は時間がかかる理由はこの工程の長さと、検証の面倒さ、記述量の多さが原因です。
スクリーンショット 2020-03-19 23.05.59.png
ビットストリームが生成されるとダイアログが表示されるのですが、Cancelをクリックしましょう。

スクリーンショット 2020-03-19 23.06.47.png

余談ですが、コンテストの提出には設計した回路のリソース量を報告するらしいので、Design Runsタブにその情報が表示されています。impl_1が配置配線までやった実際のリソース消費量です。他の情報は見積もり値なので、この値を報告しましょう。

ビットストリームが生成された後の処理

このままFPGAに書き込みかと思ったら、ファイルの準備が必要です。面倒ですがあと少し!
スクリーンショット 2020-03-19 23.08.49.png
File -> Export を選択してHardware, Block Design, Bitstream Fileを出力します。Export Hardwareではinclude bitstreamにチェックを入れておきます。
スクリーンショット 2020-03-19 23.10.03.png
スクリーンショット 2020-03-19 23.10.23.png
以上の作業を行えば、プロジェクトのディレクトリに4つのファイルが置かれるので、リネームして名前を合わせておきます。この名前を覚えておきましょう。

  • pynq_ultra96_conv_l0_r1.bit (そのまま)
  • design_1.tcl -> pynq_ultra96_conv_l0_r1.tcl
  • design_1_wrapper.hdf -> pynq_ultra96_conv_l0_r1.hdf
  • design_1.hwh -> pynq_ultra96_conv_l0_r1.hwh

ようやく作業終了です!!いよいよUltra96V2で(やたらと遅い)ハードウェアを動かしてみましょう!!

10
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
10
4

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?