導入
今、気になってる生成AI関連のソフトウェアをここで列挙したい。仕事と次々とリリースされるAI関連のソフトウェアの忙しなさが合わさって、現在、AI関係を触れてないのでここで自分でも忘れないように全部書いていく。
➀dify ai:
オープンソースのLLMOpsプラットフォーム。コーディング不要でAIアプリを素早く構築可能。スケーラビリティに優れ、大規模なAIワークフローの管理にも対応。
➁metagpt:
複数のGPTエージェントが協調して複雑なタスクを解決するマルチエージェントフレームワーク。エージェント間の対話や役割分担により、高度な問題解決を実現。
➂open interpreter:
ChatGPTのCode Interpreterをオープンソース化したプロジェクト。プログラミングや分析タスクの自動化を支援。豊富なプログラミング言語に対応。
➃wolfram alpha LLM:
Wolfram Alphaの膨大な知識ベースを活用した大規模言語モデル。数学、科学、社会情報など幅広い分野の質問に対して正確な回答を提供。
➄open interface:
LLMアプリケーション開発のためのオープンソースプラットフォーム。プラグイン機能により、外部ツールとの連携が容易。開発者コミュニティによる活発な貢献が特徴。
➅viggle ai:
動画コンテンツを理解し、要約や検索を可能にするAI。自然言語処理と画像認識技術を駆使し、動画の内容を効率的に分析。
⑦aider:
LLMを用いたプログラミングアシスタント。コードの自動生成、エラー修正、リファクタリングなどを支援。開発者の生産性向上に寄与。
⑧gpt pilot:
GPTモデルを使った対話型のタスク自動化ツール。ユーザーとの対話を通じて、様々な作業を自動化。シンプルなインターフェースが特徴。
⑨butter fish:
自然言語処理に特化したオープンソースのPythonライブラリ。テキスト前処理、言語モデル、評価指標など、多彩な機能を提供。
その他単語
RAG (Retrieval-Augmented Generation):
検索とLLMを組み合わせた手法。関連する文書を検索し、その情報を元にLLMが回答を生成。外部知識を活用することで、LLM単体よりも正確で詳細な回答が可能。
notion ai:
人気のナレッジ管理ツールNotionにAI機能を統合。文章生成、要約、翻訳、アイデア提案など、様々なタスクをAIがサポート。生産性向上と創造性発揮に役立つ。
ベクトルDB:
データを高次元のベクトルで表現し、類似度検索に特化したデータベース。自然言語処理やコンピュータビジョンなど、AIの分野で広く活用。大規模データからの高速な類似データ検索を実現。
worldsoin:
OpenAIのCEOが関与する仮想通貨プロジェクト。虹彩認証で人間性を証明すると、無料でトークンを取得可能。AIの発展により人間とボットの区別が難しくなる未来に備え、全人類に公平な経済的恩恵を与えることを目標とする。
雑感
open interpreterは、おそらく多くの人が使ったことがあるであろうツール。最近、使ってみたいのがAIエージェント化するツールとしてdify ai,metagpt。wolfram alpha LLMは、数学、計算系でよく聞く。open interfaceもAIエージェント関連だった気がする。viggle aiは、動画編集がよく話題になっている。aiderは、対話型でプログラミングを手伝ってくれる。その他もろもろ。
展望
これからの大きな流れ(すでにそうだが)は、間違いなくAIエージェントを組織してタスクを片付けるツールの氾濫が起こる。現在は1対1で我々が対話している。しかし、これからは人間の指示に従って組織したAIたちが話し合って役割分担してタスクをやり遂げる。それらは前提条件として、生成AIのAPIを使ってどんなサービスが提供できるかが開発者の考えるべき焦点になる。
生成AIをヘビーユーズしている人間の中では、すでにchatbotは一機能に収まって、APIの料金に頭を悩ませている。むしろ、APIのほうが今となっては主として我々の生活に与える影響量ははるかに大きい。open interpreterを使用しているが、心からの感動は得られていない。それは高機能なもの(chatgpt4,claud ai 3 opus)が無限にお金を溶かすためである。現在は、gpt-3.5-turbo,claud ai haikuなどで使用するのが無難だと思う。
まだ、複数AIエージェントツールを使っていないのでわからないが、それらのソフトウェアで使われている言語モデルは何か?料金体系はどのようか?といったことがツールを使う側としては大きな問題となる。
これまで、紹介してきた中でAIエージェントを駆使したツールはすでに多く出てきている。ここで思うのは、騒がれているdevin aiは特別なものでも何でもない。オープンソースのgithubを見ればいくらでも似たようなものがある(open interpreterもその一つ)。devin aiがそのような言語モデルを使い、どんな料金体系化を知らないので何とも言えないが、とても素晴らしいものかもしれないし、ただUIが充実しただけの情弱ツールであるかもしれない。
おすすめのツールがあれば、教えていただきたい。