2023年7月に初版発行されたStephen Wolfram「ChatGPTの頭の中(WHAT IS ChatGPT DOING...AND WHY DOES IT WORK?)」で Wolfram|Alphaが紹介されていたのをきっかけに、Wolfram Alphaを含め生成AIの数学能力を補うにはどのようなものがあるか改めて整理してみました。
生成AIの数学能力の実力
GPTなど生成AIが人間よりも苦手とされてきた数学能力ですが、(基本的なレベルであれば)Gemini UltraやGPT-4(5-shot)などでは90%を超える能力を既に持っています。
GSM8KおよびMATHデータセットは以下のようなものです。50%台のMATHはかなり難易度の数学能力、90%台のGSM8Kは基本レベルのタスクです。
- GSM8K(Grade School Math 8K) : 以下のような小学校レベルの文章題(2から8ステップで基本的な算術演算(+ − × ÷)を利用して解ける問題。賢い中学生なら100点をとれるレベル)
(引用元:Hugging Face(Datasets:gsm8k) から抜粋)
- MATH : 代数、幾何、微積分などを含むかなりの難易度
(引用元:github(MATH) から抜粋)
ChatGPTは言語統計以外の方法を手にいれている
ChatGPTは、Advanced Data Analysisという解決方法を手にいれています(ChatGPT Plusで利用可能)。自然言語的統計的なもっともらしさをそのまま答えるのではなく、算出するためのコードを生成し、そこから答えを導いてくれます。
Open Interpreter
ChatGPT Advanced Data Analysisのようなコードを生成をコマンドラインから実行できるオープンソース。今回のような簡単な計算以外にもファイルを入力とした分析など様々なタスクを行えるようです。今回はGPT4を利用しましたが、ローカルモデルも指定できます。
Wolfram Alpha
こちらが、今回、生成AIの数学能力について考えるきっかけになったWolfram|Alphaです。
例えば、各都市の座標とその間の距離を計算するアルゴリズムなど、独自の計算能力を持っている知識ベースの計算エンジンです。数学、科学、地理、歴史、金融など幅広い分野にわたる情報を持っていて、特に数学的な計算やデータ分析、統計情報の提供に強みがあるとされています。
自然言語をインターフェースとしているため、GPTと連携し、Wolframの計算知識を利用することが可能になっているようです(プラグインとしても利用できるようです)。
LangChainからWolframを使ってみる
1.Wolfram|Alpha APIを利用する(サインアップとログイン)
以下のサイトの手順にそって実行しました。
- Wolfram|Alpha Developer Portalにアクセス
- Don't have an account? Create one >>をクリック
- If you don't have a Wolfram ID, create one hereをクリック
- メールアドレス(Wolfram IDになる)、名前、パスワードを入力して利用規約に同意しWolfram IDを作成
- 作成したWolfram IDでサインイン
- [Get an App ID]をクリック
- 名前、説明、API(今回はLLM APIを選択)を入力してSubmitをクリック
- AppIDを取得(画面にAPP IDが表示されます)
2.Wolfram|Alpha APIをつかってみる
以下のサイトを参考に実行しました(記載されている手順通りで実行することができました)
# 1.パッケージのインストール
!pip install openai
!pip install langchain
!pip install wolframalpha
# 2.変数を準備
%env OPENAI_API_KEY=XXXXXXXXXXXXXXXXXXXXXXXXXX
%env WOLFRAM_ALPHA_APPID=XXXXXXXXXXXXXXXXXXXXXXXXXX(上で取得したAPP ID)
# 3.WolframAlphaツールを持つエージェントの準備
from langchain.agents import load_tools, initialize_agent
from langchain.llms import OpenAI
from langchain.chains.conversation.memory import ConversationBufferMemory
# エージェント
agent = initialize_agent(
tools=load_tools(['wolfram-alpha']), # Wolfram|Alpha
llm=OpenAI(temperature=0),
agent="conversational-react-description",
memory=ConversationBufferMemory(memory_key="chat_history"),
verbose=True
)
# 4.問い合わせを実行
agent.run("東京都と大阪の距離は?")
感想
Wolframの無料枠では利用可能な範囲が限られているようでしたが、金融のアドバイス(個人財務アシスタント)なども提供されているようです。ただ、Wolframは、あくまで各領域の計算能力を自然言語をインターフェースとして利用する、といった印象です。ニーズにあった計算知識がWolframにあれば、GPTの強化として利用できるかもしれませんが、数学能力では「Advanced Data Analysis」「Open Interpreter」の活用、その他の領域でもGPTのさらなる進化で、どこまでWolframなどを利用する価値がでてくるのかは両者の今後の進展次第かもしれません。