はじめに
今年は「watsonx」「IBMの大規模言語モデル」「AI Aliance」とIBM関連の話題も盛りだくさんでしたね。何を書こうかな、と考えながら過去の講演資料を見直していたところ、AI史にちらほら「Watson」の文字が。
人工知能研究の新潮流 ~日本の勝ち筋~ 国立研究開発法人科学技術振興機構 研究開発戦略センター
2011年のクイズ王に勝利して一躍話題になったWatson。今回は当時のことを思い出しながら、AI史において特別な位置を占めるIBM Watsonについて、その歴史や2016年の日本市場での展開を、振り返ってみたいと思います。
IBM Watsonの誕生と Jeopardy! での勝利
Jeopardy!でのIBM Watsonの活躍は、AIの分野において注目すべき快挙でした。
当時のWatsonは、IBMのDeepQAテクノロジーを基盤としていました。このシステムは、大量の並列処理を行い、複数のPOWER7プロセッサを使用しています。特に注目すべきは、Watsonが使用する 90台 のIBM Power 750サーバーです。各サーバーは3.5 GHzのPOWER7 8コアプロセッサを使用し、全体で2,880のPOWER7プロセッサスレッドと16テラバイトのRAMを搭載しています。これにより、Watsonは1秒間に500ギガバイト(約100万冊の本に相当)の情報を処理することが可能でした。
Watsonのデータソースには、百科事典、辞書、類語辞典、ニュース記事、文学作品などが含まれていました。また、DBPedia、WordNet、Yagoなどのデータベースや分類体系も活用されています。IBMのチームは、Watsonに何百万ものドキュメントを提供し、その知識ベースを構築しました。
Watsonの主な革新は、新しいアルゴリズムの創出ではなく、数百の実証済み言語解析アルゴリズムを同時に迅速に実行する能力にあります。Watsonは質問をキーワードと文の断片に分解し、統計的に関連するフレーズを探します。複数のアルゴリズムが独立して同じ答えを見つけるほど、Watsonが正しいとされる可能性は高まります。最終的に、Watsonは可能な解答を絞り込み、そのデータベースを確認して、解答が理にかなっているかを判断します。
これらの技術的側面が組み合わさることで、WatsonはJeopardy!のようなクイズ番組で人間のチャンピオンに対抗することができました。
あのWatsonが使えるようになる!商業提供への移行
Jeopardy!での勝利の後、IBMはWatsonの商業化の可能性を探求しました。2011年に設立されたWatsonビジネスユニットは、このAI技術の開発と商業化に専念するためのものでした。当初の目標はヘルスケア分野でしたが、その応用範囲は銀行業、保険業、通信業など、情報量が多い産業全般に及んでいました。
Jeopardy!でのWatsonと商業版Watsonは同じ起源を持ちながらも、実際には異なる存在です。商業版Watsonは、複数のユーザーからの同時に複数の複雑なクエリに対応できるように再設計されました。
また、Watsonチームは、Jeopardy!で使用された41の個別サブシステムを理解し、ビジネス環境に適応させる必要がありました。その最初の年に、システムは高速化され、サイズも小型化されました。Jeopardy!で使用された部屋サイズのシステムが、冷蔵庫の野菜室サイズのサーバーで動作するようになっています。
IBMはWatsonをクイズショーの勝者から、実用的なビジネスツールへと進化させました。その過程で、Watsonは多岐にわたる産業での潜在的な応用を示しました。
2013年頃にWatsonがAPI提供される発表があり、エンジニア仲間とかなり盛り上がった記憶があります。あのWatsonが誰でも使えるようになるのか!と。
日本市場でのIBM Watson
日本市場におけるIBM Watsonの展開は2015年頃から、その技術的な進化と市場適応の面で注目すべき進歩を遂げています。日本でのWatsonの導入は、主にSoftBankとのパートナーシップを通じて行われました。
日本語に対応したWatson APIが開発され、各社がWatsonの能力をより広範囲に活用できるようになりました。当時のAPIには、自然言語分類(NLC)、対話(Dialog)、情報検索の最適化(R&R)などがありました。その後、APIの統廃合もありました。
以下2枚のスライドは、2017年の水曜ワトソンカフェで登壇した時の資料です。懐かしい!
登壇タイトルは 「第2回 IBM Watson 日本語版ハッカソン」振り返りとWatson営業あるある。
そういえばハッカソンに社内メンバーと出場なんてしてたな~。当時アイディア賞をいただき、賞品で1人1台プレステ4をもらって箱を抱えて帰ったのが本当に懐かしいです。
最新のWatsonを試してみよう
今年は「watson.ai」「watson.data」「watson.governance」が発表されました。
watson.aiでは、様々な基盤モデルを試すことができます。使い方も、今回のAdvent Calendarで紹介されていますので、ぜひ触ってみてください。
なんと @yanagih さんが、Advent Calendarの記事を読みやすくジャンル別に整理してくださっていました。
こちらをガイドに、年末年始はWatsonを楽しんでください。
AC2023: IBM Watson/watsonxインデックス
ちなみに私は「watsonx.aiでニュース記事分類チャレンジ!」と称して、おなじみニュースタイトルのジャンル分類、今回はIBMの基盤モデル「Slate」を使ってやってみよう!、という記事を書く予定でしたが、いろいろハマってしまって……こちらは年明けくらいにまとめたいと思います。