はじめに
SB Intuitionsが日本語に特化したコンパクトな大規模言語モデル(LLM)をリリースしました。
https://www.sbintuitions.co.jp/blog/entry/2025/03/07/093143
MITライセンスでHugging Faceに公開されていたので、試しに使ってみました。
実施したこと
- Google Colabで動かしてみる
- ChatGPTとの比較
- 同等の小規模日本語モデル TinySwallow-1.5Bとの比較
Google Colabで動かしてみる
パラメータ数1Bモデルのsarashina2.2-1b-instruct-v0.1をGoogle Colabで動かしてみました。
https://huggingface.co/sbintuitions/sarashina2.2-1b-instruct-v0.1
モデルのロードからサンプルの応答生成は数分で完了。
ChatGPTとの比較
日本語特化ということなので、古文を題材にして質問してみます。
枕草子の有名な一節を与え、作者と作品名を答えてもらいます。
sarashina2.2-1b-instruct-v0.1の結果
user_input = [{"role": "user", "content": "やうやう白くなりゆく山際、という一節は誰の何という作品ですか?"}]
# モデルによる応答生成
responses = chat_pipeline(
user_input,
max_length=100,
do_sample=True,
num_return_sequences=3,
)
# 応答を表示
for i, response in enumerate(responses, 1):
print(f"Response {i}: {response['generated_text']}")
1分ほど考えて結果が返ってきました。さすがにGoogle Colabでそのまま実行しただけではレスポンスはゆっくり。
結果は次のとおりです。3つ出力されたうちの一つ目をピックアップしています。作者と作品名は見事正解。ただ、この一節は第百十段ではなく、第一段。この辺りは、聞き方を工夫して、作者と作品名に限定すればいいかもしれません。
「やうやう白くなりゆく山際」という一節は、日本の著名な文学作品である『枕草子』の第百十段に登場します。
この一節は、清少納言による随筆の中で、春の夕暮れの情景を美しく描写したものです。
彼女は「やうやう白くなりゆく」という表現を用いて、空の色合いがゆっくりと白んでいく様子 ...
ChatGPT4の回答
同じ質問をChatGPT4にしてみました。芭蕉の俳句になってしまいました。
「やうやう白くなりゆく山際」という一節は、松尾芭蕉の有名な俳句です。この句は、冬の訪れを感じさせる山の風景を描写しています。
芭蕉の俳句は季節感を捉えた表現が特徴的で、自然との一体感を詠み込んでいます。
この句もそんな彼の作品の一つとして、日本の古典文学や俳句愛好家に愛され続けています。
ChatGPT4oの回答
こちらは流石に正解。
「やうやう白くなりゆく山際」という一節は、清少納言の『枕草子』の冒頭部分に含まれています。
### **出典**
『枕草子』の有名な冒頭部分:
春はあけぼの。やうやう白くなりゆく山際、少しあかりて、紫だちたる雲の細くたなびきたる。
この文章は、春の夜明けの美しさを描写したもので、日本の随筆文学を代表する名文の一つです。
sakana.ai TinySwallow-1.5Bとの比較
sakana.aiからも公開されている小規模日本語言語モデルTinySwallow-1.5Bとも比較してみました。こちらのモデルはWebLLMで動くウェブアプリが公開されていて、ウェブブラウザ上でさくさく応答します。素晴らしい。
https://pub.sakana.ai/tinyswallow/
さて、質問に対する答えは以下のとおりです。こちらは夏目漱石になってしまいました。
「やうやう白くなりゆく山際」の文は、夏目漱石の小説『夢十篇』に登場します。
この作品では、主人公の老いた父親が、残された息子に自分の晩年の心境を語る場面で使われています。
「やうやう白くなりゆく山際」は、主人公の父親が描かれている晩年の風景を表現したものです。具体的には、
人生の終わりに近づきつつある
自分自身を取り巻く環境が変化し始める
変化に伴って心身ともに衰えつつある
といった内容を含んでいます。
夏目漱石はこの作品を通じて、老いと死について深く考えさせられる内容となっています。
まとめ
はるかにパラメータ数が少ないにも関わらずChatGPT4よりも正確な答えが返ってきました。”日本語特化”のポテンシャルを感じました。
言語モデルはWebLLM等を利用したエッジ処理が今後普及していくのでは?と個人的には考えていますので、コンパクトな特化型モデルは今後も様々なものが出てくるのではないかなと思います。楽しみです。