2023年12月22日の記事を横目で見ながら、llm-jp-13b-instruct-full-dolly_en-dolly_ja-ichikara_003_001-oasst_en-oasst_ja-v1.1に「パソコンのキーボードは,なぜABC順・五十音順ではないのですか」と尋ねてみることにした。プログラムはこんな感じ。
#! /usr/bin/python3
from transformers import pipeline
tgn=pipeline("text-generation","llm-jp/llm-jp-13b-instruct-full-dolly_en-dolly_ja-ichikara_003_001-oasst_en-oasst_ja-v1.1",max_new_tokens=512)
nlp=lambda txt:tgn(f"以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。\n\n### 指示:\n{txt}\n\n### 応答:\n")[0]["generated_text"]
print(nlp("パソコンのキーボードは,なぜABC順・五十音順ではないのですか"))
実行してみたところ、私(安岡孝一)の手元では以下の結果が出力された。
以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。
### 指示:
パソコンのキーボードは,なぜABC順・五十音順ではないのですか### 応答:
パソコンのキーボードは、アルファベット順や五十音順ではなく、一般的には「かな」で表記されています。「かな」とは、日本語のローマ字表記のことで、「あ」行から「ん」行までの10行のローマ字を使って日本語を表記する方法です。
ローマ字は、英語圏の人々が日本語を理解するために作られたもので、日本語の発音をローマ字で表しています。
ローマ字を使って日本語を入力するには、まずキーボードの「あ」行のキーを探します。
次に、ローマ字の「a」のキーを探します。
ローマ字の「a」のキーを探したら、そのキーを押して、ローマ字の「あ」を入力します。
ローマ字の「あ」を入力したら、キーボードの「い」行のキーを探します。
次に、ローマ字の「i」のキーを探します。
ローマ字の「i」のキーを探したら、そのキーを押して、ローマ字の「い」を入力します。
ローマ字の「い」を入力したら、キーボードの「う」行のキーを探します。
次に、ローマ字の「u」のキーを探します。
ローマ字の「u」のキーを探したら、そのキーを押して、ローマ字の「う」を入力します。
ローマ字の「う」を入力したら、キーボードの「え」行のキーを探します。
次に、ローマ字の「e」のキーを探します。
ローマ字の「e」のキーを探したら、そのキーを押して、ローマ字の「え」を入力します。
ローマ字の「え」を入力したら、キーボードの「お」行のキーを探します。
次に、ローマ字の「o」のキーを探します。
ローマ字の「o」のキーを探したら、そのキーを押して、ローマ字の「お」を入力します。
ローマ字の「お」を入力したら、キーボードの「か」行のキーを探します。
次に、ローマ字の「k」のキーを探します。
ローマ字の「k」のキーを探したら、そのキーを押して、ローマ字の「か」を入力します
うーん、GPT-2の13Bモデルだと60GBはメモリが要るのだけど、それでも、この程度なのかなぁ。