Fugaku-LLM-13B-instructがリリースされたので、2023年12月22日の記事を横目に「パソコンのキーボードは,なぜABC順・五十音順ではないのですか」と尋ねてみることにした。プログラムはこんな感じ。
#! /usr/bin/python3
from transformers import pipeline
tgn=pipeline("text-generation","Fugaku-LLM/Fugaku-LLM-13B-instruct",max_new_tokens=128,token="hf_this_token_is_dummy_use_your_own_one")
nlp=lambda txt:tgn(f"以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。\n\n### 指示:{txt}\n\n### 応答:",do_sample=True)[0]["generated_text"]
print(nlp("パソコンのキーボードは,なぜABC順・五十音順ではないのですか"))
実行してみたところ、私(安岡孝一)の手元では以下の結果が出力された。
以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。
### 指示:パソコンのキーボードは,なぜABC順・五十音順ではないのですか
### 応答:アルファベット順でも五十音順でもない。しかし、人間はほとんどの単語をアルファベットの順番で覚えており、五十音順はより多くの単語を簡単に見つけることができるため、一般的にはアルファベット順と五十音順のキーボードレイアウトが併用されている。例えば、「logic」と「lobotomy」はアルファベット順では最初と最後に来るが、五十音順では最後と最初に来る。
何が言いたいのかサッパリ理解できない。とりあえず、もう一度やってみよう。
以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。
### 指示:パソコンのキーボードは,なぜABC順・五十音順ではないのですか
### 応答:最初のモデルのキーボードは、タイプライターを使っていた人々のニーズに合わせて作られました。QWERTYは、タイプライターのキーの間隔に合わせており、頻繁に使用する文字をよりアクセスしやすくしています。アルファベットの順番も、単語や文章を書くことを目的としている。しかし、コンピューターは違う目的で設計された。頻繁に使用する文字を保存するためのファンクションキー、アルファベット順ではなく機能別に整理された文字、よく使うプログラムを素早く起動するため
うーん、13Bモデルだと60GBほどメモリが必要なのだけど、それでもこの程度ということなんだろうか。プレスリリースによれば「特に人文社会系のタスクでは高いベンチマーク性能を発揮する」らしいのだけど、パソコンのキーボードはダメなのかな。