LoginSignup
0
3

オープンソース最強日本語対応LLM、RWKV-4-World-JPNtunedをGoogleColabで試す!!

Last updated at Posted at 2023-10-14

オープンソースの中で日本語最強のRWKVを皆様御存知でしょうか?
RWKV(Raven's World-Knowledge Vectors)は、RNNとTransformerの性能を組み合わせたモデルです。
このモデルは、GPT Transformerのように直接トレーニングでき(並列化可能)、Transformerレベルの言語モデル(LLM)の性能を持っています。
また文字数に入力制限がないところが特徴です。

💡 RWKVについて超ざっくり説明するとGPTのオープンソース版で、入力文字数に制限がありません。

今回はこのモデルの日本語版がGPT-4、GPT3.5の次の3位になったと下記のツイートに作者が投稿しています。

https://x.com/BlinkDL_AI/status/1679816885695807489?s=20

今回はこのモデルが、どんな性能か少し遅いですが見ていこうかなと思います。

Jupyterで簡単に動かせるノートブックを作ったのでそちらで検証していきたいと思います。

使うもの

BlinkDL/rwkv-4-worldとは

BlinkDL/rwkv-4-world · Hugging Face

rwkv-4-worldは、100以上の世界の言語から学習されたモデルで、そのトレーニングデータは英語が70%、他の多言語が15%、コードが15%で構成されており、

データのソースには、さまざまなソースから収集されたデータが使用されており、「Some_Pile」、「Some_RedPajama」、「Some_OSCAR」、「All_Wikipedia」、「All_ChatGPT_Data_I_can_find」などが含まれています。このモデルはMC4、OSCAR、Wikipediaなどのデータセットでファインチューニングされてるとのことです。

検証

ノートブックのインポート

RWKV_ChatRWKV_WORLDシリーズ専用.ipynb - Colaboratory (google.com)
まずはこちらから、GoogleColabにノートブックをインポートします。

◆下記はリポジトリ
https://github.com/umaxiaotian/RWKV-Notebook

GoogleColabランタイムの設定

デフォルトの設定で行く場合、必ずA100~T4のハイメモリを指定してください。
Untitled.png
この設定を選べば、「ランタイム>すべてのセルを実行」で、デフォルトの設定のまま実行できます。
Untitled 1.png

RWKV-Worldの感想

これはすごいです。正直ここまで的確に返してくれるとは思っていませんでした。
さすが日本語LLM3位なだけありますね。
日常会話、とくに対人チャットには支障はなさそうです。
Untitled 2.png
ただ、コード生成部分ではまだ課題がありそうです。
Untitled 3.png
全然答えてくれていません。
しかし、フリーでここまでできるのはすごいです。コードのデータセット持ってきてファインチューニングすれば答えれるようにもなりますし、期待です。

0
3
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
3