Anthropic社のLLM Claude3を試してみた
最新の言語モデル技術を駆使したAnthropic社のLLM Claude3.0を手に入れ、その機能や性能を試してみました。驚くべき機能に触れると共に、実際の使用体験をお届けします。
ユーザー登録の手順
まず最初に行ったのは、Anthropic社のLLM Claude3.0にユーザー登録です。
https://claude.ai/login
新規登録は英語画面でしたが、問題なく作成することができました。Googleアカウントを利用したため、簡単な手続きでアカウントを作成することができました。
新機能の紹介
ログインすると、新機能の紹介が表示されました。今回のバージョンでは、テキストだけでなく画像を認識し、様々な処理を行うことが可能になっています。具体的には、画像から料理のレシピを提案したり、画像中のテキストを認識してJSONファイルに変換したりすることができます。
画像認識の実験
興味深い機能を試すべく、ネット上から適当な画像を取得し、LLM Claude3.0に投入してみました。その結果、思ったより高性能でびっくりしました。ChatGPTの画像認識性能についてはまだ試していないので比較はできないのですが。
- 企業のLLMに関するプレゼン資料の図を投入したところ、LLMは図の内容をしっかりと理解し、テキストに変換して提供してくれました。これにより、プレゼン資料の内容をテキストデータとして簡単に取り出すことができるようです。会社だと社内のドキュメントをLLMに入れるのが簡単になりそうですね。PowerPointとか一括でいられて認識できるようになるといいのですが、いずれはそうなっていくと思います。
- 請求書の画像を投入してみたところ、一部の文字の誤認識はあったものの、請求書の全体的な内容理解に問題はありませんでした。請求書っていろいろなフォーマットがあるので事務の方が手入力しているケースが多いと思うのですが、解像度が高ければAIに置き換えできるようになる日も遠くないと思います。ただ誤認識はあるので人によるチェックは必要ですが、今後事務系の人数は大きく削減されると思います。
今後の展望
無料で提供される枠を使い切ってしまったため、今回の試行はここまでとなりました。普段は主にClaude2.1をメインで使用しているのですが、画像が読めるというのは大きいです。
Anthropic社のLLM Claude3.0は、その優れた画像認識技術や高度なテキスト処理能力により、様々な業務やプロジェクトに革新をもたらす可能性を秘めていると思います。
プロンプトでできる工夫とか精度とかも見ていけたらと思います。