0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Ollama Gemma3で画像認識を試す

Last updated at Posted at 2025-03-17

1. 概要

Gemma3(2025年3月12日に発表)は、テキストだけでなく画像や短いビデオも処理可能なマルチモーダルモデルであり、140以上の言語に対応している。

今回はOllama上でGemma3を使用し、画像のオブジェクト認識と属性値抽出タスクをしてみます。
さらに、画像を異なるサイズ(1024, 512, 256, 128, 64, 32, 16)にリサイズ(アスペクト比を維持)し、認識結果の変化を確認してみます。

2. 実行環境

  • M2 Macbook Air RAM 16GB
  • Ollama 0.6.0
  • Gemma3:4b
  • Python

3. 準備

Ollamaをインストールしていない方はインストール
インストーラの手順に従ってみてください。

ollamaの起動とモデルのインストール

今回はgemma3:4bを使用。他にもモデルがあるので適宜選択。

ollama pull gemma3:4b
ollama serve

これで、http://localhost:114341 にOllamaのAPIサーバーが起動します。

ライブラリ

pip install requests pillow

4. 画像の認識

まず最初は、以下のプロンプトでシンプルに画像を認識させてみます。

コードを表示
import time
import requests
import base64
from PIL import Image
import io
from typing import Optional

def load_and_resize_image(image_path: str, max_size: int = 512) -> str:
    """
    画像を読み込み、アスペクト比を維持しながら最大辺をmax_sizeにリサイズ。
    リサイズ後、Base64エンコードした文字列を返す。
    """
    image = Image.open(image_path)
    w, h = image.size

    if max(w, h) > max_size:
        if w >= h:
            new_w = max_size
            new_h = int(h * (max_size / w))
        else:
            new_h = max_size
            new_w = int(w * (max_size / h))
        image = image.resize((new_w, new_h), resample=Image.LANCZOS)

    buffer = io.BytesIO()
    image.save(buffer, format="PNG")
    return base64.b64encode(buffer.getvalue()).decode("utf-8")

def generate_text(prompt: str, image_path: Optional[str] = None, max_new_tokens: int = 300, max_size: int = 512) -> str:
    """
    指定したプロンプトからGemma3:4bモデルでテキスト生成を実施する。
    画像パスが渡された場合、画像入力モードになり、リサイズ時のmax_sizeが反映される。
    """
    url = "http://localhost:11434/api/generate"  # Ollamaサーバーのエンドポイント
    payload = {
        "model": "gemma3:4b",
        "prompt": prompt,
        "max_new_tokens": max_new_tokens,
        "temperature": 0.5,
        "top_p": 0.95,
        "stream": False
    }

    if image_path:
        encoded_image = load_and_resize_image(image_path, max_size=max_size)
        payload["images"] = [encoded_image]

    response = requests.post(url, json=payload)
    response.raise_for_status()
    data = response.json()
    return data.get("response", "")

if __name__ == "__main__":
    prompt = "この画像に写っているオブジェクトを認識して簡潔に説明をしてください。"
    image_path = "/Users/momo/Desktop/test.jpg"
    result= generate_text(prompt, image_path=image_path)
    print(result)

入力画像

test.jpg

プロンプト

この画像に写っているオブジェクトを認識して簡潔に説明をしてください。

出力結果

この画像には、以下のオブジェクトが含まれています。

*   **日本の庭園:** 鮮やかな紅葉の木々が特徴的な、日本の伝統的な庭園が写っています。
*   **石組:** 庭園の中には、様々な大きさの石組が配置されています。
*   **木造建築:** 庭園を眺めるための木造の建物(障子や格子戸が特徴的)が、画像の一部として写っています。
*   **人物:** 庭園を歩いている人物が写っています。

全体として、日本の伝統的な風景と建築が調和した美しい写真です。

5. 実験

風景画像のオブジェクト認識 と 商品画像の属性値抽出タスクで、異なる画像サイズを入力した時の認識結果の変化を確認します。
また、生成の揺れを見るために同じ画像サイズで3回生成することにします。


タスクごとにプロンプトを変更して以下のコードを使用します。
コードを表示
import time
import requests
import base64
from PIL import Image
import io
from typing import Optional

def load_and_resize_image(image_path: str, max_size: int) -> str:
    """
    画像を読み込み、アスペクト比を維持しながら最大辺をmax_sizeにリサイズ。
    リサイズ後、Base64エンコードした文字列を返す。
    """
    image = Image.open(image_path)
    w, h = image.size

    if max(w, h) > max_size:
        if w >= h:
            new_w = max_size
            new_h = int(h * (max_size / w))
        else:
            new_h = max_size
            new_w = int(w * (max_size / h))
        image = image.resize((new_w, new_h), resample=Image.LANCZOS)

    buffer = io.BytesIO()
    image.save(buffer, format="PNG")
    return base64.b64encode(buffer.getvalue()).decode("utf-8")

def generate_text(prompt: str, encoded_image: Optional[str] = None, max_new_tokens: int = 300) -> str:
    """
    指定したプロンプトからGemma3:4bモデルでテキスト生成を実施する。
    画像のBase64エンコード済み文字列が渡された場合、画像入力モードとして利用する。
    """
    url = "http://localhost:11434/api/generate"
    payload = {
        "model": "gemma3:4b",
        "prompt": prompt,
        "max_new_tokens": max_new_tokens,
        "temperature": 0.5,
        "top_p": 0.95,
        "stream": False
    }
    
    if encoded_image:
        payload["images"] = [encoded_image]
    
    response = requests.post(url, json=payload)
    response.raise_for_status()
    data = response.json()
    return data.get("response", "")

if __name__ == "__main__":
    max_sizes = [1024, 512, 256, 128, 64,32,16]
    prompt = """
    適宜プロンプトを変更
    """
    image_path = "test.jpg"  # 実際の画像パスに変更してください
    num_trials = 3  # 各 max_size ごとの試行回数

    final_results = {}

    # 各 max_size ごとに画像処理は1回だけ実施し、試行ごとに実行時間と生成結果を記録
    for size in max_sizes:
        print(f"Processing max_size = {size}...")
        encoded_image = load_and_resize_image(image_path, max_size=size)
        trial_results = []
        for trial in range(1, num_trials + 1):
            print(f"  Trial {trial} for max_size = {size} started...")
            start_time = time.perf_counter()
            result = generate_text(prompt, encoded_image=encoded_image, max_new_tokens=300)
            result = result.replace('```json','').replace('```','')
            print(result)
            elapsed = time.perf_counter() - start_time
            trial_results.append((elapsed, result))
            print(f"  Trial {trial} for max_size = {size} finished in {elapsed:.2f}")
        final_results[size] = trial_results
        print(f"Completed processing for max_size = {size}\n")
    # 結果を指定のマークダウン形式で整形し、result.txt に書き出す
    output_lines = []
    output_lines.append("# 実験結果\n")
    for size in max_sizes:
        # 各 max_size ごとの平均実行時間を計算
        times = [trial[0] for trial in final_results[size]]
        avg_time = sum(times) / len(times)
        
        output_lines.append(f"<details>")
        output_lines.append(f"<summary>max_size={size} 生成結果(クリックで展開)</summary>")
        output_lines.append("\n```console")
        for trial, (elapsed, result) in enumerate(final_results[size], 1):
            output_lines.append(f"Trial {trial}: {elapsed:.2f}")
            output_lines.append(result)
            output_lines.append("")
        output_lines.append(f"平均実行時間: {avg_time:.2f}")
        output_lines.append("```")
        output_lines.append("</details>\n")
    
    final_output = "\n".join(output_lines)
    
    # result.txt に書き出し
    with open("result_json.txt", "w", encoding="utf-8") as f:
        f.write(final_output)
    
    print("結果は result.txt に書き出されました。")

5.1 オブジェクト認識

プロンプト

この画像に写っている細いオブジェクトから大きなオブジェクトまで網羅的に抽出してください。また。その理由も簡潔につけてください。回答は日本語です。
出力形式はjsonです。
{"object":"", "reason":""}

入力画像

test.jpg

結果

size (px) objects
1024 寺, 庭, 木, 人, 柵, 石, 道, 植物, 空
512 寺院, 庭園, 木, 石組, 柵, 人物, 空
256 庭, 木, 石, 道, 柵, 人物, 建物
128 山, 湖, 木, 紅葉, 橋, 建物, 塀
64,32 風景, 湖, 橋, 木, 山, 空, 建物, 草
16

総合的な印象
全体として、解像度が高いほど局所特徴(建物の細部、石組、障子、人物など)が捉えられ、シーンの詳細な理解が可能となる。一方、解像度が下がると、局所特徴は失われる代わりに、画像全体の大域的な特徴(風景やシルエット、色彩のパターン)が主に認識されるようになる。やはり、細かい認識精度が求められる用途には高解像度が適しており、大まかなシーンの分類や検索など、全体の雰囲気だけで十分な場合には中低解像度でも問題ないかもしれない。

生成結果の詳細

※実行時間は生成する長さや環境に依存するので参考値(Ollamaは内部キャッシュされている(?)のか2回目からは実行時間は短縮した)

max_size=1024 生成結果(クリックで展開)
Trial 1: 51.11秒

[
  {"object": "寺", "reason": "屋根と木造建築の構造が寺院の特徴と一致する"},
  {"object": "庭", "reason": "石組、植物、水路など、日本庭園の特徴的な要素が見られる"},
  {"object": "木", "reason": "紅葉したカエデやその他の木々が多数見られる"},
  {"object": "人", "reason": "庭園を歩いている人物が複数いる"},
  {"object": "柵", "reason": "庭園の周囲に設置された木製の柵が見える"},
  {"object": "石", "reason": "庭園内の石組や岩場"},
  {"object": "道", "reason": "庭園内を歩行者が歩いている道"},
  {"object": "植物", "reason": "様々な種類の植物が庭園に植えられている"},
  {"object": "空", "reason": "雲が浮かぶ青空"}
]

Trial 2: 10.79秒

[
  {"object": "寺院", "reason": "画像が寺院の内部から撮影されており、障子や床、庭などが寺院の構造物として認識される"},
  {"object": "庭", "reason": "寺院の内部には石組や植物を含む庭が配置されている"},
  {"object": "石組", "reason": "庭に配置された石のグループ"},
  {"object": "植物", "reason": "庭に配置された様々な種類の植物、特に紅葉した木々"},
  {"object": "紅葉", "reason": "紅葉した木々"},
  {"object": "木", "reason": "紅葉した木々"},
  {"object": "障子", "reason": "寺院の内部に設置された木製の格子戸"},
  {"object": "床", "reason": "寺院の内部に設置された木製の床"},
  {"object": "人物", "reason": "寺院の庭を歩いている人"},
  {"object": "柵", "reason": "庭の周囲に設置された木製の柵"}
]

Trial 3: 7.58秒

[
  {"object": "寺 (dera)", "reason": "背景に寺の建物が見える"},
  {"object": "庭 (niwa)", "reason": "石組や植物が配置された景観"},
  {"object": "木 (ki)", "reason": "紅葉や緑葉の木々"},
  {"object": "石組 (ishikumi)", "reason": "庭に配置された石の配置"},
  {"object": "人 (hito)", "reason": "庭を歩いている人"},
  {"object": "柵 (sabbaru)", "reason": "庭を囲む柵"},
  {"object": "道 (michi)", "reason": "庭の中を歩く道"},
  {"object": "建物 (zukuri)", "reason": "寺の建物"}
]

平均実行時間: 23.49秒
max_size=512 生成結果(クリックで展開)
Trial 1: 50.40秒

[
  {"object": "寺 (tera)", "reason": "背景に寺の建物が見える"},
  {"object": "庭園 (teien)", "reason": "石組や植物が配置された景観"},
  {"object": "木 (ki)", "reason": "紅葉や緑葉の木々"},
  {"object": "石組 (ishikomi)", "reason": "庭園に配置された石の配置"},
  {"object": "柵 (sabbaru)", "reason": "庭園の縁に沿って設置された柵"},
  {"object": "人物 (jinbutsu)", "reason": "庭園を歩いている人物"},
  {"object": "空 (sora)", "reason": "背景に広がる空"}
]
Trial 2: 9.16秒

[
  {"object": "寺", "reason": "建物全体の構造、屋根、障子などが寺院建築の特徴を示している"},
  {"object": "庭", "reason": "石組、植物(紅葉、緑葉)、水場など、日本庭園の要素が見られる"},
  {"object": "紅葉", "reason": "赤や黄色に染まった落葉が、秋の紅葉を象徴している"},
  {"object": "緑葉", "reason": "紅葉とは対照的に、緑色の葉が豊富に見られる"},
  {"object": "石組", "reason": "様々な形や大きさの石が配置された、日本庭園特有の景観"},
  {"object": "人", "reason": "庭園を歩いている人物が写っている"},
  {"object": "柵", "reason": "庭園の縁を囲む柵が、景観を区切っている"},
  {"object": "道", "reason": "庭園内を歩行するための道"}
]

Trial 3: 8.04秒

[
  {"object": "寺", "reason": "建物全体の構造、屋根、障子などが寺院建築の特徴と一致する"},
  {"object": "庭園", "reason": "石組、植物、水景などが日本庭園の要素と一致する"},
  {"object": "木", "reason": "紅葉した木々が特徴的で、秋の風景を示す"},
  {"object": "石", "reason": "庭園に配置された石組が特徴的"},
  {"object": "人", "reason": "歩道を歩いている人物が写っている"},
  {"object": "柵", "reason": "庭園の縁を囲む柵が写っている"},
  {"object": "道", "reason": "歩道が庭園内を横切っている"},
  {"object": "空", "reason": "雲が浮かぶ青空が背景となっている"}
]

平均実行時間: 22.54秒
max_size=256 生成結果(クリックで展開)
Trial 1: 49.62秒

[
  {"object": "庭", "reason": "石、植物、道、柵など、日本庭園の特徴的な要素が多数含まれている"},
  {"object": "木", "reason": "紅葉した木々が特徴的で、秋の庭園を象徴している"},
  {"object": "石", "reason": "庭園に配置された石が、景観を構成している"},
  {"object": "道", "reason": "庭園内を歩行者が通行する道"},
  {"object": "柵", "reason": "庭園の境界を囲む柵"},
  {"object": "人物", "reason": "庭園内を歩いている人物"},
  {"object": "建物", "reason": "背景に写る建物は、庭園の建物である"}
]

Trial 2: 3.91秒

{
  "object": ["山", "庭", "木", "人", "柵", "石", "建物"],
  "reason": "画像には、緑豊かな山々、整然と配置された庭園、色とりどりの木々(特に紅葉)、歩道、柵、石、そして建物のシルエットが写っています。これらの要素が、日本の伝統的な庭園や風景の一部であると判断しました。"
}

Trial 3: 8.29秒

[
  {"object": "庭", "reason": "石組、植物、道など、日本庭園の特徴的な要素が複数見られるため"},
  {"object": "木", "reason": "紅葉した木々が複数見え、季節感があるため"},
  {"object": "石", "reason": "庭に配置された石組が複数見られるため"},
  {"object": "道", "reason": "庭園内を歩行者が歩いている道が確認できるため"},
  {"object": "人物", "reason": "庭園内を歩いている人物が複数見られるため"},
  {"object": "障子", "reason": "画像が障子越しに見えるため、障子の格子が確認できる"},
  {"object": "柱", "reason": "建物の柱が確認できる"},
  {"object": "柵", "reason": "庭園の周りに設置された柵が確認できる"}
]

平均実行時間: 20.61秒
max_size=128 生成結果(クリックで展開)
Trial 1: 50.29秒

[
  {"object": "山", "reason": "画像の中に山が大きく存在し、風景の一部を占めている"},
  {"object": "湖", "reason": "水面が鏡のように静かで、湖の水面であることがわかる"},
  {"object": "木", "reason": "画像全体に木々が密集しており、緑色に染まっている"},
  {"object": "紅葉", "reason": "一部の木々が赤色に染まっており、紅葉している"},
  {"object": "橋", "reason": "湖の上に橋が架けてられている"},
  {"object": "建物", "reason": "遠景に建物が見える"},
  {"object": "塀", "reason": "画像枠の背景に塀が配置されている"}
]

Trial 2: 7.70秒

[
  {"object": "山", "reason": "画像の中に山が明確に見える"},
  {"object": "池", "reason": "水面が鏡のように静かで、池である可能性が高い"},
  {"object": "木", "reason": "緑の葉を持つ木々が密集して存在"},
  {"object": "紅葉", "reason": "一部の木々が赤色に染まっている"},
  {"object": "橋", "reason": "池の上に橋が架かっている"},
  {"object": "建物", "reason": "遠景に建物のシルエットが見える"},
  {"object": "塀", "reason": "建物の周りに塀が囲まれている"},
  {"object": "竹", "reason": "竹が写っている"},
  {"object": "空", "reason": "空の色が写っている"}
]

Trial 3: 7.03秒

[
  {"object": "山", "reason": "画像の中に山が明確に見える"},
  {"object": "池", "reason": "水面が鏡のように静かで、池である可能性が高い"},
  {"object": "木", "reason": "緑の葉を持つ木々が多数存在"},
  {"object": "紅葉", "reason": "一部の木が赤色に染まっており、紅葉している"},
  {"object": "建物", "reason": "遠景に建物が見える"},
  {"object": "柵", "reason": "池の周りに柵が設置されている"},
  {"object": "門", "reason": "建物の前に門が見える"},
  {"object": "橋", "reason": "建物の前に橋が見える"}
]

平均実行時間: 21.67秒
max_size=64 生成結果(クリックで展開)
Trial 1: 48.94秒

[
  {"object": "風景", "reason": "画像全体に広がる山々、湖、木々といった自然の要素が確認できる"},
  {"object": "湖", "reason": "水面が反射した光が確認できる"},
  {"object": "橋", "reason": "赤い橋が水面を横切っている"},
  {"object": "木", "reason": "緑色の葉を持つ木々が密集している"},
  {"object": "山", "reason": "遠くに山々が見える"},
  {"object": "空", "reason": "青色の空が広がっている"},
  {"object": "建物", "reason": "橋の近くに建物のシルエットが見える"}
]

Trial 2: 8.56秒

[
  {"object": "風景", "reason": "画像全体が自然の風景(山、川、木々など)を示している"},
  {"object": "山", "reason": "画像中央部に高い山々が見える"},
  {"object": "川", "reason": "水面が映っていることから川が流れている"},
  {"object": "橋", "reason": "赤い橋が水面を渡っている"},
  {"object": "木々", "reason": "山や川の周りに木々が密集している"},
  {"object": "葉", "reason": "紅葉の色から、木々の葉が赤や黄色に変化している"},
  {"object": "空", "reason": "青い空が背景に見える"},
  {"object": "建物", "reason": "橋の近くに建物のシルエットが見える"},
  {"object": "道", "reason": "橋の横に白い道が見える"}
]
Trial 3: 6.50秒

[
  {"object": "風景", "reason": "画像全体に広がる山々、湖、木々といった自然の要素が確認できる"},
  {"object": "湖", "reason": "水面が反射した光が確認できる"},
  {"object": "橋", "reason": "赤い橋が水面を横切っている"},
  {"object": "木", "reason": "緑色の葉を持つ木々が密集している"},
  {"object": "山", "reason": "遠くに山々が見える"},
  {"object": "空", "reason": "青い空が広がっている"},
  {"object": "建物", "reason": "橋の近くに建物のシルエットが見える"}
]

平均実行時間: 21.34秒
max_size=32 生成結果(クリックで展開)
Trial 1: 48.40秒

[
  {"object": "木", "reason": "画像に緑色の木々が多数存在するため"},
  {"object": "湖", "reason": "画像に水面が映っているため"},
  {"object": "山", "reason": "画像に遠くに山が連なっているため"},
  {"object": "建物", "reason": "画像に建物のシルエットが確認できるため"},
  {"object": "空", "reason": "画像全体を覆う青い空が確認できるため"},
  {"object": "草", "reason": "画像に緑色の草地が広がっているため"}
]

Trial 2: 4.40秒

[
  {"object": "木", "reason": "画像に緑色の木々が多数存在"},
  {"object": "水面", "reason": "青色の水面が確認できる"},
  {"object": "建物", "reason": "赤い屋根を持つ建物が確認できる"},
  {"object": "山", "reason": "背景に山が確認できる"},
  {"object": "空", "reason": "青い空が背景に広がる"}
]

Trial 3: 5.29秒

[
  {"object": "湖", "reason": "水面が鏡のように反射しており、湖の水面である可能性が高い"},
  {"object": "木", "reason": "緑色の葉を持つ木々が密集して存在"},
  {"object": "山", "reason": "遠くに山が連なっている"},
  {"object": "空", "reason": "青い空が広がっている"},
  {"object": "建物", "reason": "遠くに建物が見える"},
  {"object": "草", "reason": "地面に広がる緑色の草"}
]

平均実行時間: 19.36秒
max_size=16 生成結果(クリックで展開)
Trial 1: 45.93秒

{
  "object": "本",
  "reason": "画像に本が写っているのが明確に見えます。"
}

Trial 2: 1.38秒

{
  "object": "本",
  "reason": "画像に本が写っているのが明確に見えます。"
}

Trial 3: 1.36秒

{
  "object": "本",
  "reason": "画像に本が写っているのが明確に見えます。"
}

平均実行時間: 16.22秒

4.2 属性値抽出

商品画像から属性ラベルと値を認識するタスク

プロンプト

この商品画像から形状・色・材質・柄・付属品・ブランド・用途など網羅的に詳細に分析し、商品説明文を書き出します。
その後に、属性値抽出してください。回答は日本語です。
**出力形式**
description:""
result:
[{"attr":"","value":""},...]

入力画像

test1.jpg

結果

size attr:value
1024px ブランド: ミズノ (MIZUNO)
種類: 安全靴
色: ブラック (アッパー), 青 (ソール)
素材: メッシュ (アッパー), ゴム (ソール)
デザイン: 紐調整式
特徴: 耐久性のあるアウトソール
用途: 作業現場
フィット感: 不明
512px ブランド: ミズノ (MIZUNO)
種類: ランニングシューズ
色: 黒 (本体), 青 (アウトソール/アクセント)
素材: メッシュ (アッパー), ゴム (ソール), TPU (アウトソール)
デザイン: フラットソール
付属品: シューレース
特徴: 軽量, クッション性, グリップ力
用途: ランニング, トレーニング, スポーツジム
256px ブランド: ミズノ
種類: 安全靴
色: ブラック
アッパー素材: メッシュ
ソール色: 青
フィット調整: 靴紐
特徴: 通気性, 耐久性
用途: 作業環境
128px ブランド: ミズノ
種類: ランニングシューズ
色: ブラック
素材: メッシュ (アッパー), ゴム (ソール)
デザイン: シンプル・ミニマル
特徴: 軽量, 通気性, クッション性
用途: ランニング, トレーニング
64px ブランド: 不明
種類: スニーカー/ランニングシューズ
色: 黒
素材: メッシュ, ゴム
特徴: 大まかな形状
用途: ランニング/スポーツ
32px ブランド: 不明
種類: シューズ
色: 黒
素材: 不明
特徴: 基本的なシルエットのみ
用途: 不明
16px ブランド: 不明
種類: スニーカー
色: 黒
素材: 不明
特徴: 単純な形状
用途: 不明

総合的な印象
同様に、解像度が高いほど、商品の属性に関する局所的なディテール(ブランド名、具体的な素材、デザインの細部、調整方法など)が抽出され、詳細な製品理解が可能となる。一方、解像度が下がると、細かいテクスチャやパターンなどの局所特徴は失われる代わりに、全体の大域的な特徴(シルエット、主要な色、カテゴリーなど)が主に認識されるようになる。ただ、画像だけでは生成された内容の正当性を計るのは難しい(素材など)、用途や種類(例:「安全靴」と「ランニングシューズ」の混同)では誤認識が発生している

生成結果の詳細

max_size=1024 生成結果(クリックで展開)
Trial 1: 61.41秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

ミズノの安全靴です。ブラックのメッシュ素材のアッパーと、青色のソールが特徴です。紐で調整できるタイプで、耐久性のあるアウトソールのようです。安全靴としての機能性を備え、作業現場での使用を想定していると考えられます。

**result:**

[
  {
    "attr": "ブランド",
    "value": "ミズノ (MIZUNO)"
  },
  {
    "attr": "種類",
    "value": "安全靴"
  },
  {
    "attr": "色",
    "value": "ブラック (アッパー), 青 (ソール)"
  },
  {
    "attr": "素材",
    "value": "メッシュ (アッパー), ゴム (ソール)"
  },
  {
    "attr": "アッパー素材",
    "value": "メッシュ"
  },
  {
    "attr": "ソール素材",
    "value": "ゴム"
  },
  {
    "attr": "デザイン",
    "value": "紐調整式"
  },
  {
    "attr": "特徴",
    "value": "耐久性のあるアウトソール"
  },
  {
    "attr": "用途",
    "value": "作業現場"
  },
  {
    "attr": "フィット感",
    "value": "不明 (画像から判断不可)"
  }
]

**補足:**

*   フィット感は画像からは判断できませんでした。
*   より詳細な情報を得るためには、製品のサイズ、重さ、防水性、滑り止め性能などの情報が必要となります。

Trial 2: 14.92秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

ミズノの安全靴です。ブラックのメッシュ素材のアッパーと、青色のソールが特徴です。シューレースで調整可能な紐留め式で、耐久性のあるアウトソールが特徴です。安全靴としての機能性を備え、様々な作業現場で活躍する可能性が考えられます。

**result:**
[
    {
        "attr": "ブランド",
        "value": "ミズノ"
    },
    {
        "attr": "種類",
        "value": "安全靴"
    },
    {
        "attr": "色",
        "value": "ブラック"
    },
    {
        "attr": "アッパー素材",
        "value": "メッシュ"
    },
    {
        "attr": "ソール色",
        "value": "青"
    },
    {
        "attr": "アッパー色",
        "value": "ブラック"
    },
    {
        "attr": "留め方",
        "value": "シューレース"
    },
    {
        "attr": "アウトソール素材",
        "value": "不明"
    },
    {
        "attr": "特徴",
        "value": "耐久性"
    },
    {
        "attr": "用途",
        "value": "様々な作業現場"
    }
]

**補足:**

*   アウトソール素材は画像から特定できませんでした。
*   詳細なサイズ、重さ、機能(滑り止め、耐油性など)は画像からは判断できませんでした。

Trial 3: 17.15秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

ミズノの安全靴(作業靴)の一脚です。ブラックのメッシュ素材のアッパーと、青色のソールが特徴です。紐で調整可能なタイプで、耐久性に優れたアウトソールのようです。安全靴としての機能性を備え、様々な作業現場で活躍する可能性が考えられます。

**result:**

[
    {
        "attr": "ブランド",
        "value": "ミズノ"
    },
    {
        "attr": "種類",
        "value": "安全靴(作業靴)"
    },
    {
        "attr": "色",
        "value": "ブラック"
    },
    {
        "attr": "アッパー素材",
        "value": "メッシュ"
    },
    {
        "attr": "ソール色",
        "value": "青色"
    },
    {
        "attr": "アッパー色",
        "value": "ブラック"
    },
    {
        "attr": "アッパー素材の特徴",
        "value": "通気性、軽量"
    },
    {
        "attr": "ソール素材",
        "value": "ゴム(詳細不明)"
    },
    {
        "attr": "留め方",
        "value": "紐"
    },
    {
        "attr": "用途",
        "value": "様々な作業現場(詳細不明)"
    },
    {
        "attr": "デザイン",
        "value": "シンプル、機能的"
    }
]

**補足:**

*   詳細な素材(アウトソール、インソールなど)や、具体的な機能(滑り止め、耐油性など)は画像からは判断できませんでした。
*   上記は画像から推測できる範囲の情報をまとめたものです。

平均実行時間: 31.16秒
max_size=512 生成結果(クリックで展開)
Trial 1: 61.14秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

この画像はミズノのスポーツシューズ(ランニングシューズまたはトレーニングシューズ)の側面図です。全体的にシンプルなデザインで、機能性と軽量性を意識したモデルと思われます。

*   **形状:** フラットなソール形状で、ランニングやトレーニングに適した安定性と推進力を提供するよう設計されています。
*   **色:** 黒色のシューズ本体と、青色のソールの縁が特徴的です。
*   **材質:**
    *   **シューズ本体:** メッシュ素材(通気性)が使用されています。
    *   **ソール:** ゴム素材(クッション性、グリップ力)が使用されています。
*   **柄:** メッシュ素材は、細かい格子状のパターンが特徴的です。
*   **付属品:**紐(シューレース)が使用されています。
*   **ブランド:** ミズノ(MIZUNO)
*   **用途:** ランニング、トレーニング、スポーツジムなど、様々なスポーツシーンで使用できる汎用性の高いシューズです。

**result:**

[
    {
        "attr": "ブランド",
        "value": "ミズノ (MIZUNO)"
    },
    {
        "attr": "色",
        "value": "黒 (本体), 青 (ソール縁)"
    },
    {
        "attr": "材質",
        "value": "メッシュ (シューズ本体), ゴム (ソール)"
    },
    {
        "attr": "柄",
        "value": "メッシュ (格子状)"
    },
    {
        "attr": "形状",
        "value": "フラットソール"
    },
    {
        "attr": "付属品",
        "value": "シューレース (紐)"
    },
    {
        "attr": "用途",
        "value": "ランニング, トレーニング, スポーツジム"
    },
    {
        "attr": "ソール",
        "value": "クッション性, グリップ力"
    }
]

以上、分析と属性値抽出の結果です。

Trial 2: 18.00秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

この画像はミズノのランニングシューズの側面図です。全体的にスリムな形状で、クッション性に優れたミッドソールと、軽量なアウトソールが特徴です。アッパーは黒色のメッシュ素材で、通気性に優れています。ひもで調整可能な紐留めシステムを採用しており、フィット感を調整できます。アウトソールは青色のTPU素材で、グリップ力と耐久性を高めています。全体的に、ランニングやトレーニングなど、スポーツ活動に適したシューズです。

**result:**

[
    {
        "attr": "ブランド",
        "value": "ミズノ (MIZUNO)"
    },
    {
        "attr": "種類",
        "value": "ランニングシューズ"
    },
    {
        "attr": "色",
        "value": "黒 (アッパー), 青 (アウトソール)"
    },
    {
        "attr": "素材",
        "value": "メッシュ (アッパー), TPU (アウトソール), ゴム (ミッドソール)"
    },
    {
        "attr": "柄",
        "value": "無地"
    },
    {
        "attr": "特徴",
        "value": "通気性、クッション性、軽量、グリップ力"
    },
    {
        "attr": "機能",
        "value": "スポーツ活動 (ランニング、トレーニングなど)"
    },
    {
        "attr": "留め具",
        "value": "紐"
    },
    {
        "attr": "形状",
        "value": "スリム"
    },
    {
        "attr": "用途",
        "value": "スポーツ"
    }
]

上記は、画像から推測できる情報を基にしたものです。より詳細な情報が必要な場合は、製品名や型番などの追加情報をご提供ください。

Trial 3: 16.41秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

この画像はミズノのランニングシューズの側面図です。全体的にスリムな形状で、クッション性に優れたミッドソールと、軽量なアウトソールが特徴です。アッパーは黒色のメッシュ素材で、通気性に優れています。ひもで調整可能な紐留めシステムを採用しており、フィット感を調整できます。アウトソールの部分は青色のTPU素材で、耐久性とグリップ力を高めています。全体的に、ランニングやトレーニングに適した、軽量で快適なシューズであることがわかります。

**result:**

[
  {
    "attr": "ブランド",
    "value": "ミズノ"
  },
  {
    "attr": "種類",
    "value": "ランニングシューズ"
  },
  {
    "attr": "色",
    "value": "黒 (アッパー), 青 (アウトソール)"
  },
  {
    "attr": "素材",
    "value": "メッシュ (アッパー), TPU (アウトソール), ゴム (ミッドソール)"
  },
  {
    "attr": "柄",
    "value": "無地"
  },
  {
    "attr": "特徴",
    "value": "軽量, 通気性, クッション性, グリップ力"
  },
  {
    "attr": "機能",
    "value": "紐留めシステム"
  },
  {
    "attr": "用途",
    "value": "ランニング, トレーニング"
  },
  {
    "attr": "形状",
    "value": "スリム"
  }
]

上記は、画像から読み取れる情報を基にした分析結果です。ご不明な点があれば、お気軽にご質問ください。

平均実行時間: 31.85秒
max_size=256 生成結果(クリックで展開)
Trial 1: 56.11秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

ミズノの安全靴です。ブラックのメッシュ素材のアッパーと、青色のソールが特徴です。通気性の高いメッシュ素材を使用しており、足元を涼しく保ちます。耐久性に優れた素材を使用しており、長時間の作業にも対応可能です。靴紐でフィット感を調整できます。安全な作業環境をサポートする安全靴です。

**result:**

[
    {
        "attr": "ブランド",
        "value": "ミズノ"
    },
    {
        "attr": "種類",
        "value": "安全靴"
    },
    {
        "attr": "色",
        "value": "ブラック"
    },
    {
        "attr": "アッパー素材",
        "value": "メッシュ"
    },
    {
        "attr": "ソール色",
        "value": "青色"
    },
    {
        "attr": "フィット調整",
        "value": "靴紐"
    },
    {
        "attr": "特徴",
        "value": "通気性、耐久性"
    },
    {
        "attr": "用途",
        "value": "様々な作業環境"
    }
]

**補足:**

*   上記は画像から推測できる情報に基づいています。
*   実際の製品には、サイズ、重さ、耐滑性、耐油性などの詳細なスペックが記載されている可能性があります。

Trial 2: 15.71秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

ミズノの安全靴です。ブラックのメッシュ素材のアッパーと、青色のソールが特徴的です。通気性の高いメッシュ素材を使用しており、足元を涼しく保ちます。耐久性に優れた素材を使用しており、長時間の作業にも対応可能です。靴紐でフィット感を調整でき、快適な履き心地を実現します。滑り止めソールにより、様々な環境での安全性を確保します。

**result:**

[
    {
        "attr": "ブランド",
        "value": "ミズノ"
    },
    {
        "attr": "種類",
        "value": "安全靴"
    },
    {
        "attr": "色",
        "value": "ブラック"
    },
    {
        "attr": "アッパー素材",
        "value": "メッシュ"
    },
    {
        "attr": "ソール色",
        "value": "青"
    },
    {
        "attr": "ソール素材",
        "value": "ゴム (推定)"
    },
    {
        "attr": "特徴",
        "value": "通気性、耐久性、滑り止め"
    },
    {
        "attr": "フィット調整",
        "value": "靴紐"
    },
    {
        "attr": "用途",
        "value": "様々な作業環境"
    }
]

**補足:**

*   ソール素材は画像から正確に特定できませんでしたが、「ゴム (推定)」と記載しました。
*   用途は、安全靴であることから、様々な作業環境で使用できると推定しました。

ご不明な点があれば、お気軽にご質問ください。

Trial 3: 14.60秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

ミズノの安全靴です。ブラックのメッシュ素材のアッパーと、青色のソールが特徴です。通気性の高いメッシュ素材を使用しており、足元は通気性に優れています。耐久性の高いソールを採用しており、長時間の作業にも対応可能です。シューレースでフィット感を調整でき、快適な履き心地を実現します。安全性を考慮した設計で、様々な作業現場で活躍します。

**result:**

[
    {
        "attr": "ブランド",
        "value": "ミズノ"
    },
    {
        "attr": "種類",
        "value": "安全靴"
    },
    {
        "attr": "色",
        "value": "ブラック"
    },
    {
        "attr": "アッパー素材",
        "value": "メッシュ"
    },
    {
        "attr": "ソール色",
        "value": "青"
    },
    {
        "attr": "ソール素材",
        "value": "(不明)"
    },
    {
        "attr": "フィット調整",
        "value": "シューレース"
    },
    {
        "attr": "特徴",
        "value": "通気性、耐久性"
    },
    {
        "attr": "用途",
        "value": "様々な作業現場"
    }
]
**補足:**

*   ソールの素材は画像から特定できませんでした。
*   安全靴の用途は、様々な作業現場として記載しました。

平均実行時間: 28.81秒
max_size=128 生成結果(クリックで展開)
Trial 1: 57.30秒
はい、承知いたしました。商品画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

この商品は、ミズノのランニングシューズのようです。全体的に黒色を基調とし、青色のアクセントカラーが施されています。アッパーはメッシュ素材で通気性に優れており、軽量で快適な履き心地を追求していることが伺えます。アウトソールはブルーのミッドソールとブラックのラバーアウトソールで構成され、クッション性とグリップ力を両立していると考えられます。ブランドロゴがさりげなく配置されており、プロのランナーにも対応できる性能を備えたシューズです。

**result:**

[
    {
        "attr": "ブランド",
        "value": "ミズノ"
    },
    {
        "attr": "色",
        "value": "黒 (アッパー), 青 (アクセント), 黒 (アウトソール)"
    },
    {
        "attr": "素材",
        "value": "メッシュ (アッパー), ラバー (アウトソール)"
    },
    {
        "attr": "柄",
        "value": "無地 (メッシュ), グリップパターン (アウトソール)"
    },
    {
        "attr": "機能",
        "value": "通気性, 軽量, クッション性, グリップ力"
    },
    {
        "attr": "用途",
        "value": "ランニング"
    },
    {
        "attr": "特徴",
        "value": "プロのランナーにも対応"
    }
]

上記は、画像から推測できる情報に基づいています。より詳細な情報を得るためには、製品の仕様や詳細な画像を確認する必要があります。

Trial 2: 16.24秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

この画像は、ミズノのランニングシューズのようです。全体的に黒色を基調とし、青色のアクセントカラーが施されています。シューズは軽量で、プロのランナーやアスリート向けのパフォーマンスを意識したデザインです。アッパーにはメッシュ素材を使用し、通気性とフィット感を両立させています。アウトソールはブルーのクッション素材で、衝撃吸収性とグリップ力を高めています。ミズノのロゴがさりげなく配置されており、ブランドの信頼感も伝わります。

**result:**

[
    {
        "attr": "色",
        "value": "黒 (ブラック)"
    },
    {
        "attr": "アクセントカラー",
        "value": "青 (ブルー)"
    },
    {
        "attr": "素材",
        "value": "メッシュ (アッパー), クッション素材 (アウトソール)"
    },
    {
        "attr": "柄",
        "value": "無地 (メッシュ部分)"
    },
    {
        "attr": "ブランド",
        "value": "ミズノ (MIZUNO)"
    },
    {
        "attr": "用途",
        "value": "ランニングシューズ"
    },
    {
        "attr": "特徴",
        "value": "軽量, 通気性, 衝撃吸収性, グリップ力"
    },
    {
        "attr": "デザイン",
        "value": "スポーティー, プロ向け"
    }
]

上記は、画像から推測できる情報を基に作成したものです。より詳細な情報を得るためには、製品の公式情報や詳細なスペックを確認する必要があります。

Trial 3: 13.84秒
はい、承知いたしました。商品画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

この商品は、ミズノのランニングシューズのようです。全体的にブラックのメッシュ素材を使用した、スタイリッシュなデザインのシューズです。アッパーはブラックのメッシュ素材で、ブルーのラインがアクセントになっています。ソール部分はブルーで、クッション性に優れたデザインです。ミズノのロゴがさりげなく配置されています。軽量で、長距離のランニングやトレーニングに適したシューズです。

**result:**

[
    {
        "attr": "ブランド",
        "value": "ミズノ"
    },
    {
        "attr": "色",
        "value": "ブラック、ブルー"
    },
    {
        "attr": "素材",
        "value": "メッシュ、ゴム"
    },
    {
        "attr": "柄",
        "value": "ライン"
    },
    {
        "attr": "用途",
        "value": "ランニング、トレーニング"
    },
    {
        "attr": "機能",
        "value": "クッション性、軽量"
    },
    {
        "attr": "デザイン",
        "value": "スタイリッシュ"
    },
    {
        "attr": "特徴",
        "value": "ミズノロゴ"
    }
]

**補足:**

*   上記は画像から推測できる情報に基づいています。
*   実際の製品には、より詳細な情報が記載されている可能性があります。

平均実行時間: 29.13秒
max_size=64 生成結果(クリックで展開)
Trial 1: 57.87秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

黒色のランニングシューズです。メロックスのロゴが刻印されており、特徴的なブルーのミッドソールが目を引きます。アッパーはメッシュ素材で通気性に優れており、軽量な設計です。ブルーのミッドソールはクッション性に優れ、快適なランニングをサポートします。シューレースでフィット感を調整でき、シュータンは柔らかい素材を使用しています。全体的にスタイリッシュで、スポーツシーンで活躍する一足です。

**result:**

[
    {
        "attr": "色",
        "value": "黒"
    },
    {
        "attr": "ブランド",
        "value": "メロックス (Mizuno)"
    },
    {
        "attr": "素材",
        "value": "メッシュ (アッパー), ゴム (アウトソール),  EVA (ミッドソール)"
    },
    {
        "attr": "特徴",
        "value": "軽量, 通気性, クッション性"
    },
    {
        "attr": "デザイン",
        "value": "スタイリッシュ"
    },
    {
        "attr": "付属品",
        "value": "シューレース"
    },
    {
        "attr": "用途",
        "value": "ランニング"
    },
    {
        "attr": "その他",
        "value": "ミッドソールにブルーのアクセントカラー"
    }
]

**補足:**

*   上記は画像から推測できる情報に基づいています。
*   より詳細な情報(サイズ、重量、防水性など)は画像からは判断できません。

Trial 2: 13.67秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

この商品は、ミズノのランニングシューズのようです。全体的にシンプルなデザインで、黒色一色でまとめられています。アッパーはメッシュ素材を使用しており、通気性に優れていると考えられます。ソール部分はクッション性に優れた素材で、ブルーのミッドソールが特徴的です。軽量で、ランニングに適したシューズです。

**result:**

[
    {
        "attr": "ブランド",
        "value": "ミズノ"
    },
    {
        "attr": "色",
        "value": "黒"
    },
    {
        "attr": "素材",
        "value": "メッシュ (アッパー), クッション性素材 (ソール)"
    },
    {
        "attr": "デザイン",
        "value": "シンプル, スポーティ"
    },
    {
        "attr": "機能",
        "value": "通気性, クッション性, 軽量"
    },
    {
        "attr": "用途",
        "value": "ランニング"
    },
    {
        "attr": "ソールカラー",
        "value": "青"
    },
    {
        "attr": "特徴",
        "value": "ミッドソールに青色のクッション"
    }
]

**補足:**

*   上記は画像から推測できる情報に基づいています。
*   実際の製品には、より詳細な情報が記載されている可能性があります。

Trial 3: 15.37秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

この商品は、ミズノのランニングシューズのようです。全体的にシンプルなデザインで、黒色一色でまとめられています。アッパーはメッシュ素材を使用しており、通気性に優れていると考えられます。ソール部分はブルーのクッションが特徴的で、クッション性と反発性を兼ね備えている可能性があります。シューレース(靴紐)が付属しており、足にフィットするように設計されています。全体的に軽量で、ランニングに適したシューズであると考えられます。

**result:**

[
  {
    "attr": "ブランド",
    "value": "ミズノ"
  },
  {
    "attr": "色",
    "value": "黒"
  },
  {
    "attr": "素材",
    "value": "メッシュ(アッパー)、ゴム(ソール)"
  },
  {
    "attr": "デザイン",
    "value": "シンプル、ミニマル"
  },
  {
    "attr": "機能",
    "value": "クッション性、通気性、軽量"
  },
  {
    "attr": "付属品",
    "value": "シューレース"
  },
  {
    "attr": "用途",
    "value": "ランニング"
  },
  {
    "attr": "ソールカラー",
    "value": "青"
  },
  {
    "attr": "形状",
    "value": "スリムフィット"
  }
]

**補足:**

*   上記は画像から推測できる情報に基づいています。
*   より詳細な情報を得るためには、製品名や型番などの情報が必要です。

平均実行時間: 28.97秒
max_size=32 生成結果(クリックで展開)
Trial 1: 58.16秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

この画像は、黒色のスポーツシューズの一脚の画像です。アッパーはメッシュ素材で構成されており、通気性が高いことが伺えます。ソールは厚めで、クッション性があるように見えます。全体的にスタイリッシュで、運動に適したデザインです。

**result:**

[
    {
        "attr": "形状",
        "value": "スニーカー / ランニングシューズ"
    },
    {
        "attr": "色",
        "value": "黒"
    },
    {
        "attr": "材質",
        "value": "メッシュ (アッパー), ゴム (ソール)"
    },
    {
        "attr": "柄",
        "value": "なし"
    },
    {
        "attr": "ソール",
        "value": "厚底, クッション性"
    },
    {
        "attr": "デザイン",
        "value": "スタイリッシュ, 運動に適したデザイン"
    },
    {
        "attr": "ブランド",
        "value": "不明"
    },
    {
        "attr": "用途",
        "value": "ランニング, トレーニング, スポーツ"
    },
    {
        "attr": "その他",
        "value": "通気性"
    }
]

**補足:**

*   ブランドは画像からは特定できませんでした。
*   詳細な機能(防水性、防臭性など)も画像からは判断できませんでした。

Trial 2: 20.10秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

この画像は、黒色のスポーツシューズの一脚です。アッパーはメッシュ素材で構成され、通気性と軽量性を両立していると考えられます。ソールは黒色のゴム製で、グリップ力が高く、様々な路面での走行に対応できるようです。全体的にスタイリッシュでモダンなデザインで、ランニングやトレーニングなど、様々なスポーツシーンで活躍するシューズです。

**result:**

[
  {
    "attr": "形状",
    "value": "スニーカー / ランニングシューズ"
  },
  {
    "attr": "色",
    "value": "黒"
  },
  {
    "attr": "材質",
    "value": "メッシュ (アッパー), ゴム (ソール)"
  },
  {
    "attr": "柄",
    "value": "無地"
  },
  {
    "attr": "ソール",
    "value": "厚底"
  },
  {
    "attr": "付属品",
    "value": "なし (画像からは確認できません)"
  },
  {
    "attr": "ブランド",
    "value": "不明"
  },
  {
    "attr": "用途",
    "value": "ランニング, トレーニング, スポーツ"
  },
  {
    "attr": "デザイン",
    "value": "スタイリッシュ, モダン"
  },
  {
    "attr": "特徴",
    "value": "通気性, 軽量性, グリップ力"
  }
]

**補足:**

*   ブランド、付属品、詳細なデザインなどは画像からは判断できませんでした。
*   上記は画像から推測できる情報に基づいています。

Trial 3: 18.26秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

この画像は、黒色のスポーツシューズの一脚の画像です。アッパーはメッシュ素材で構成され、つま先部分は補強材が施されています。ソールは黒色で、クッション性に優れたデザインです。全体的にスタイリッシュで、運動に適したデザインです。

**result:**

[
    {
        "attr": "形状",
        "value": "スニーカー (ランニングシューズ)"
    },
    {
        "attr": "色",
        "value": "黒"
    },
    {
        "attr": "材質",
        "value": "メッシュ (アッパー), ゴム (ソール)"
    },
    {
        "attr": "柄",
        "value": "なし (無地)"
    },
    {
        "attr": "付属品",
        "value": "なし (画像からは確認できません)"
    },
    {
        "attr": "ブランド",
        "value": "不明"
    },
    {
        "attr": "用途",
        "value": "ランニング, トレーニング, スポーツ"
    },
    {
        "attr": "デザイン",
        "value": "スタイリッシュ, スポーティ"
    },
    {
        "attr": "特徴",
        "value": "メッシュ素材, クッション性ソール"
    }
]

**補足:**

*   ブランドは画像からは特定できません。
*   付属品(シューレース、箱など)は画像からは確認できません。
*   商品の詳細(サイズ、重量、機能など)は、画像だけでは判断できません。

平均実行時間: 32.17秒
max_size=16 生成結果(クリックで展開)
Trial 1: 53.24秒
## 説明文

この画像は、黒色のスニーカーの一部分を捉えたものです。全体的に滑らかな曲線を描き、現代的なデザインが施されています。ソール部分は厚めで、クッション性のある素材が使用されている可能性があります。シュータン部分は、柔軟性があり、足の動きを妨げないように設計されていると考えられます。全体的に、スタイリッシュで洗練された印象を与えます。

## 属性値抽出

result:
[
    {"attr": "形状", "value": "スニーカー"},
    {"attr": "色", "value": "黒"},
    {"attr": "材質", "value": "不明 (滑らかな曲線から、合成皮革、またはメッシュ素材が推測される)"},
    {"attr": "柄", "value": "なし"},
    {"attr": "ソール", "value": "厚底"},
    {"attr": "デザイン", "value": "現代的、洗練"},
    {"attr": "用途", "value": "カジュアル、ストリート"},
    {"attr": "ブランド", "value": "不明"},
    {"attr": "付属品", "value": "なし (画像からは確認不可)"}
]

Trial 2: 18.57秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

この画像は、黒色のスニーカーの一脚を捉えたものです。全体的に滑らかなシルエットで、光沢のある素材が使用されていることが伺えます。ソール部分は黒色で、アッパー部分は光沢のある黒色またはダークグレーで、光を反射して存在感を増しています。デザインはミニマルで、洗練された印象を与えます。

**result:**

[
    {
        "attr": "形状",
        "value": "スニーカー (ローカット)"
    },
    {
        "attr": "色",
        "value": "黒 (ダークグレー)"
    },
    {
        "attr": "材質",
        "value": "光沢のある合成皮革、ゴム (ソール)"
    },
    {
        "attr": "柄",
        "value": "なし (無地)"
    },
    {
        "attr": "付属品",
        "value": "なし (画像からは確認不可)"
    },
    {
        "attr": "ブランド",
        "value": "不明"
    },
    {
        "attr": "用途",
        "value": "カジュアル、ストリート"
    },
    {
        "attr": "デザイン",
        "value": "ミニマル、洗練"
    },
    {
        "attr": "特徴",
        "value": "光沢のある素材、滑らかなシルエット"
    }
]

**補足:**

*   ブランド、付属品、詳細な材質などは画像からは特定できませんでした。
*   用途は、デザインの雰囲気からカジュアル、ストリートファッションに適していると推測しました。

ご不明な点があれば、お気軽にお尋ねください。

Trial 3: 19.47秒
はい、承知いたしました。画像から詳細な分析と商品説明文、属性値抽出を行います。

**description:**

この画像には明確な形状が確認できません。しかし、黒色のシューズ(靴)のシルエットが確認できます。デザインは現代的で、スニーカーのような形状をしていると考えられます。素材感は不明ですが、光沢のある素材で、滑らかで洗練された印象を与えます。

**result:**

[
  {
    "attr": "形状",
    "value": "スニーカー(靴)のシルエット"
  },
  {
    "attr": "色",
    "value": "黒"
  },
  {
    "attr": "材質",
    "value": "不明(光沢のある素材)"
  },
  {
    "attr": "柄",
    "value": "なし"
  },
  {
    "attr": "デザイン",
    "value": "現代的、洗練された"
  },
  {
    "attr": "ソール",
    "value": "黒色のソール"
  },
  {
    "attr": "付属品",
    "value": "なし(画像からは確認できません)"
  },
  {
    "attr": "ブランド",
    "value": "不明"
  },
  {
    "attr": "用途",
    "value": "カジュアル、ストリートファッション"
  },
  {
    "attr": "サイズ",
    "value": "不明"
  },
  {
    "attr": "その他",
    "value": "光沢があり、滑らかな質感"
  }
]

**補足:**

*   画像がぼやけているため、詳細な情報を抽出することは困難です。
*   上記は、画像から推測できる範囲での情報です。
*   実際の商品の情報と異なる可能性があります。

平均実行時間: 30.43秒

まとめ

Gemma3のオブジェクト認識は、高解像度では細かいディテールまで認識できる一方、低解像度ではシルエットやカテゴリレベルのものになりました。
特に商品属性値の抽出では、一部の誤認識も見られたので、より正確な情報を得るにはプロンプトの工夫やテキスト情報との組み合わせが必要です。
今回は2枚の画像のみなので一般化はできないけれど、入力する画像の解像度を調整することで認識させる概念の粒度をコントロールできそうです。

しかし何より、4bのマルチモーダルモデルがこれだけの性能が出るのですから、他の様々なタスクで応用が進みそうですし、これからが楽しみですね。

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?