Poster-gen なるものが出た
論文の解説は内容が難しく、正しく解説できる自信がないので
今回はどうやって使うか、その方法を紹介します。
そのほかにも、GPT-5にポスターを作成させた例もあります。
https://qiita.com/Yh_Taguchi/items/3bf12d3f13672b6801d8
論文情報
- 掲載紙:Arxiv
- 2025年8月24日発表
- Git : https://github.com/Y-Research-SBU/PosterGen
Paper2Poster
おそらく今回のPoster-genの前身となったのはこれかな?
https://arxiv.org/abs/2505.21497
WSL2での実装
Macでの実装は少し待ってね、、、
実装環境
使用しているPCのスペックはこんな感じです。
CPU : intel Core i9-10850K
メモリ : 128GB
GPU : NVIA GeForce RTX 3080
環境構築
conda create -n poster_gen python==3.11 -y
conda activate poster_gen
#作業ディレクトリ作成
mkdir PosterGen
cd PosterGen
git clone -b main https://github.com/Y-Research-SBU/PosterGen.git
pip install -r requirements.txt
モデルの利用の前に注意点
LLMのAPIを必要とするが、OpenAIのAPIは有料なので(下記参照)
実装の際には注意が必要そうです。
最新のモデルに移行したいのか、昔のモデルが高い感じしますね。
今回はあくまでお試し程度なので、Poster-genで使えるモデルの中でいっちゃん安いgpt4.1-miniのモデルを選択しようと思います。
(下画像参考)
使えるのは
- gpt-4.1-2025-04-14 (default)
- gpt-40-2024-08-06
- gpt-4.1-mini-2025-04-14
実際にモデルを動かそう
APIの問題がOkなら実際に動かしてどんな感じか見てみましょう。
#OpenAI-APiを利用する場合
OPENAI_API_KEY="your_openai_key"
#Claude-APIを利用する場合
ANTHROPIC_API_KEY="your_anthropic_key"
#よくわかんないけど中国のモデル?を利用する場合
ZHIPU_API_KEY="your_zhipu_key"
それではAPI_KEYを保存する.envファイルを作成します。
#今回はOPENAI-APIを利用します。
touch .env
vi .env
#ここからvimの画面になりますので、一度"i"キーを押します。
#これにてinsertモードに切り替わったので、先ほどのものを入力します。
OPENAO_API_KEY="sk~~~"
#入力が完了したら :wq を押して完了です。
次に、ポスターを生成するのに必要なデータを入れていきます。
ls
#PosterGenの下にdataというディレクトリがあるので、そこへ移動
cd data
#作成したい論文の名前のディレクトリを作成する(今回は自分が過去に読んだ論文を試しにやってます、好きに変えてください)
mkdir AF-cluster
#正確にはAF-clusterの手法を改良したものだけど、、、
cd AF-cluster
作成したディレクトリ内に3つのデータを入れていきます。
論文のPDF,学校などの機関のロゴ、発表する学会などのロゴ
今回はScience Tokyo, CBI学会とします。
また、学校等のロゴはaff.pngとして、学会などの発表機関のロゴはlogo.pngとしてください。
このようなイメージです。↓
python -m src.workflow.pipeline \
--poster_width 54 --poster_height 36 \
--paper_path ./data/AF-cluster/paper.pdf \
--text_model gpt-4.1-mini-2025-04-14 \
--vision_model gpt-4.1-mini-2025-04-14 \
--logo ./data/AF-cluster/logo.png \
--aff_logo ./data/AF-cluster/aff.png
内容を確認
うーん、思ってたのと違う。。。。
gpt-4.1-miniだからか?
ログを確認したところ、今回使用したToken数は
38,867 tokens
使用したモデルがgpt-4.1-miniで1M tokensで$0.4でした。
なので、39K tokensとすると、$0.0152
日本円の金額にすると、2.28円でした。
まぁ、安いけど、このレベルならすぐ作れるので、
これに金かけてんのもなんか嫌ですね。。。
ちなみに時間としては4,5分で出力しました。
gpt-4.1モデルで再チャレンジ
そんなにToeknsを消費しないようなので、gpt-4.1で再挑戦
gpt-4.1が$2で
gpt-4.1-miniが$0.4
だったので、ざっくり2倍として考えても10円なので、結果比較してみましょうか。
python -m src.workflow.pipeline \
--poster_width 54 \
--poster_height 36 \
--paper_path ./data/AF-cluster/paper.pdf \
--text_model gpt-4.1-2025-04-14 \
--vision_model gpt-4.1-2025-04-14 \
--logo ./data/AF-cluster/logo.png \
--aff_logo ./data/AF-cluster/aff.png \
出力されました。
結果はどうでしょうか。
先ほどよりは体裁などがややまとまってはいますが、
それでも全然ダメそうですね。
結論まだ実用化には遠い
もしかしたら、gpt-5やほかの論文とかならうまくできるのかも?
あくまで、全部AIに作らすのではなく、修正をすぐ行うための
時短アイテム見たいな位置づけですね。
以上






