IBM Watson 知りたいこと早わかり ~ 何ができる「知能」なのか、従来の 機械学習 や DeepLearning との違い、Watsonアプリ の開発環境、Watsonアプリ 開発事例コード、産業利用の事例 を ワン・ストップ で まとめて おさえる

  • 104
    いいね
  • 0
    コメント
この記事は最終更新日から1年以上が経過しています。

0. がん患者の病名判断で、日本国内で実績を上げたIBM Watson

スクリーンショット 2016-08-05 9.18.20.png

スクリーンショット 2016-08-05 9.21.45.png

東京大学医科学研究所の附属病院は、アメリカの大手IT企業IBMなどと協同で、人工知能を備えたコンピューターシステム「ワトソン」に2000万件に上るがん研究の論文を学習させ、診断が極めて難しく治療法も多岐にわたる白血病などのがん患者の診断に役立てる臨床研究を進めています。

このうち60代の女性患者は当初、医師から「急性骨髄性白血病」と診断されこの白血病に効果がある2種類の抗がん剤の治療を数か月間、受けましたが、意識障害を起こすなど容体が悪化し、その原因も分かりませんでした。このため、女性患者の1500に上る遺伝子の変化のデータを人工知能に入力し分析したところ、人工知能は10分ほどで女性が「二次性白血病」という別のがんにかかっていることを見抜き、抗がん剤の種類を変えるよう提案したということです。女性は、治療が遅れれば、免疫不全による敗血症などで死亡していたおそれもありましたが、人工知能が病気を見抜いた結果命を救われ、無事退院しました。

こうした病名の診断は、現在、複数の医師が遺伝情報のデータと医学論文を突き合わせながら行っていますが、データが膨大なため必ずしも結論にたどり着けるかどうか分からないということです。東京大学医科学研究所附属病院では、この女性患者以外にも医師では診断が難しかった患者2人について、人工知能が特殊な白血病だと見抜き、治療方針が決定されるなど合わせて41人について、治療や診断に役立つ情報を人工知能が提供したということです。

(中略)

病院は、回復が見えない山下さんの病気の原因を人工知能を使って探りました。まず山下さんの遺伝子を詳しく調べ変化が起きている箇所を1500箇所ピックアップしました。これらの変化がどう関わって病気を引き起こしているのか人工知能に分析させたところ僅か10分後には「STAG2」と呼ばれる遺伝子の変化が根本の原因を作り出している「二次性白血病」である可能性が高いことを見抜いたということです。このため、病院は、別の治療薬に変えるなど治療方針を変更。その結果、山下さんの体調は徐々に回復し、去年9月には退院することができました。

(中略)

東京大学医科学研究所が導入している人工知能を備えたコンピューターシステム「ワトソン」は、遺伝子の変化が複雑に絡み合って発症する白血病などの血液がんの分析を主な対象にしています。

宮野教授によりますと、これらの分野では論文の数が膨大になりすぎて、どの遺伝子の変化が互いにどのように影響し、がんを引き起こしているのか、医師一人一人が理解するのが不可能になりつつあります。ワトソンはこうした論文を2000万件以上読み込んでいて、数多くの遺伝子の変化がどのように絡み合いがんになるのか学習しています。

そして、そこに患者の遺伝子の変化の情報を入力すると、膨大な論文の中から、まず関係するものを選び出してきます。そのうえで、それらの論文に書かれた内容をもとに患者の遺伝子の変化が互いにどのように影響し合っているのか評価し、さらに病気を引き起こす根本となった重要な変化はどれかを突き止めて効果が期待できる治療薬などを提案します。

こうした医療分野での人工知能の活用はアメリカで先行していて、すでに複数の病院で白血病や脳腫瘍の治療の支援などに使われています。



1. Watsonが解くのは、投げかけられた英語や日本語の質問で「問われていること」を「理解」して、すでに学習済みの「知識データベース」をもとに「考えて」(論理推論)、「答え」を「生成」して、返す という 問題

各専門領域の知識 を 蓄えて、人間の「専門家」(エキスパート)が「専門的な判断」を下す際に、参考となる(専門的な)推論・判断 を 提示して、人間の専門家の意思決定 を 支援する マシン

IBMは、Watson を 人工知能(A.I.)マシンと呼ばずに、一貫して、「コグニティブ・コンピューティング」(Cognitive computing)と呼び通している。

経験を通じてシステムが学習し、相関関係を見つけて仮説を立てたり、また成果から学習することができるシステム。Cognitive Computing。

人間のように経験と知識に基づいて問題を解決する仕組みを、コンピュータで実現すること。膨大なビッグデータから有効な情報を見つけ出すシステムへの応用が期待されている。

2011年2月16日、米国のクイズ番組「Jeopardy!」で、コンピュータがクイズ王に勝利しました。そのコンピュータは、米IBMが2007年から開発を進めてきた質問応答システム「Watson(ワトソン)」です。

Watsonの特徴は、最適な解答を、過去の経験や知識に基づいて自ら見つけ出すことです。これは、人がクイズを解く過程に似ています。人はクイズに出題されそうな情報を事前に新聞や本、ネットなどから収集。それらの情報から正解を推測し、最適な解答を選び出します。

 このように人が経験や知識などに基づいて行動することを「認知」と呼びます。実はWatsonは認知力を持ったコンピュータで、こうしたコンピュータの利用を「コグニティブ(認知型)・コンピューティング」と呼びます。ビッグデータ分析に不可欠な技術として注目されています。


add.PNG


2. 1970〜80年代の人工知能の主流 「エキスパート・マシン」や日本の巨大国家プロジェクト「第5世代コンピュータ」との違い

1982年、財団法人 新世代コンピュータ開発機構が設立され、次世代コンピュータを研究、開発するための国家プロジェクトが始まった。

このときに開発しようとしていたのが推論するコンピュータ、考えるコンピュータであり「第5世代コンピュータ」と呼ばれていた。いわゆる旧来のAIである。

こうしたものと、IBMが現在推し進めているコグニティブ・コンピューティングとは何が違うのか?日本IBM 東京基礎研究所 技術理事の武田浩一氏に話を訊いた。

旧来のAIのように脳を模倣するものではない

「(非手続き型プログラミング言語の)Prolog中心の推論エンジンを作ろうというものでした」と言うのは、日本IBM 東京基礎研究所 技術理事の武田浩一氏だ。

この第5世代コンピュータは、現在IBMが強力に推し進めているコグニティブ・コンピューティングと考え方は似ている。

とはいえ、今と大きく違うのは当時はデータがなかったことだ。

もちろん、Webも存在しなかければ、電子化されたWikipediaのようなものもない。

「データがなかったことは、ものすごいハンディだったと思います」と武田氏。

( 以下、上記 記事より写真を転載 )

2.PNG

先日、IBMの大和研究所が移転して、新たに豊洲に東京ラボラトリーを開所したとのおしらせをいただき、記念セミナーに呼んでいただきました。

IBMの研究所といってもいろいろあるそうなんですが、東京ラボラトリーは基礎、ハードウェア、ソフトウェア、3つが揃っていて、強力なんです、というお話がメインだったわけなんですが、個人的に、俄然、興味があったのが、基礎の部分で、IBMが誇るコンピュータ「ワトソン」のお話でした。

アメリカでクイズ王を倒した、クイズを解くすごいコンピュータ「ワトソン」の開発に係わった武田さんのお話を聞けるということで、とても楽しみにいってきました。ということで、その部分だけブログしてみました。

ワトソンのプロジェクトが始まったのは2006年。lBM 100周年にあわせたグランドチャレンジということで、武田さんも本当にできるのかなと、当初は思ったそうです。

ちなみに、IBM のグランドチャレンジというと、チェスで世界一になった Deep Blue 以来15年振りなんだそうです。

ワトソンのチャレンジは人間のように考えるコンピュータ。人間には簡単でもコンピュータには難しい分野です。

そう聞いて思い出すのが、あの、第五世代コンピュータプロジェクト。多額の予算をつぎ込んだけど、うまくいかず、いまや大失敗プロジェクトの代名詞です。

いや、まったく成果がなかったわけではなくて、実はワトソンでも Prolog が一部で使われているとのことでしたが、どれだけ難しいかよくわかるので、ワトソンも同じことにならなければ、と思っていたそうです。

当時とワトソンの大きな違いは、大量にアクセスできる情報。ワトソンもエキスパートシステムだが、各種の辞書だけでなく、ウィキペディアを始めとした大量の情報がネット上に存在していて、それらも利用している。

フォークソノミーな情報を分析して大量にアクセスできるようにしたことで、ワトソンはクイズにチャレンジできるだけの能力を得られたのだそうです。

そういう意味ではインターネットの申し子的存在ですね。

ワトソンが挑戦したのは「Jeopardy!」というクイズ番組で、50年以上前からある歴史のある番組。

ここで、歴代でも強力なチャンピオン二人、74連勝したというケン・ジェニングスとそのケンを越えて賞金王なブラッド・ラッターを相手に3日間参加しました。

単純にクイズを解くだけでなく、問題の分野や賞金の選択もゲームの一環ということであわせて考えないといけなくて、これを含めてワトソンはチャレンジしたのだそうです。ふむふむ。

──グーグルを筆頭に、人工知能がビジネスとして注目を集めています。

このごろ「なぜ最近人工知能がよく出てくるのか」とよく質問されるけど、人工知能はもう57年の歴史がある。3回目なの、人工知能ブームは。

最初は1956年。チェスとか定理証明とかを対象に人に、どれだけ迫れるかという感じでやってた。

でも産業界からのニーズはチェスや定理証明じゃない。実際の問題が解けないから、ブームはすぐに沈滞した。

1970年代はまったく冬の時代。ただ大学で基礎研究は継続されていて、2回目の人工知能ブームは1982年、第5世代コンピューターのとき。

当時の通産省が人工知能コンピューターを国家プロジェクトで作ろうとしていたことがあった。

1000億円プロジェクトの大失敗
知能はできたがデータがない

──第5世代コンピューターというと。

LSI、VLSIというのでコンピューターの世代分けを第1から第4まではハードウェアでやっていた。真空管、トランジスター、LSI、VLSI……。VLSIを使ったコンピューターを第4世代コンピューターと呼んでいて。

ハードは重要じゃないから、そこに載っけるソフトウェアで次の第5世代コンピューターというのを考えようとしたわけ。

人工知能を中心としたソフトウェアを載せたコンピューターを第5世代コンピューターと呼ぼうと言ったのが1982年。

──個人的ですが、私が生まれる1年前のことです。

570億円というすごいお金をかけて、そこから13年間やっていた。
民間の電機メーカーからもどんどんお金を出させたので、トータルで1000億円と言われている。

-─第5世代コンピューターの構想を聞く限り、現在のグーグルと同じようなことをやろうとしていたように思えます。

当時の提言書を見たら、まさに今の人工知能ブームでやっているようなことをやろうと書かれていた。

何がダメだったのか──。

1000億円かけて世界一速い推論コンピューターはできた。1秒間に5億回の三段論法を実行するコンピューター。人間はそんなに三段論法使わないよという話もあったけど、とにかく世界最高速の推論マシンを作った。

その点からすると成功だったが、推論だけでできるのは、たとえば人工知能ブームでの将棋とかチェスとか囲碁とか。

日常生活を考えると、知識というのが非常に重要。インターネットの前だから、電子化されたテキストが非常に少ないし、大規模な知識が作れなかった。知識がなかったら何もできないだろうと。

( 参考 )第5世代コンピュータ、エキスパート・マシン とは?


エキスパートシステム(英語:expert system)は人工知能研究から生まれたコンピュータシステムで、人間の専門家(エキスパート)の意思決定能力をエミュレートするものである。

専門家のように知識についての推論によって 複雑な問題を解くよう設計されており、通常のプログラミングのようにソフトウェア開発者が設定した手続きに従うわけではない。1970年代に人工知能の研究者によって開発され、1980年代にわたって商業的に適用され、AIソフトウェアとして最初に成功を収めた形態である。__
日本語訳では専門家システムと言う場合もある。

エキスパートシステムは基本的に、特定の分野の問題についての情報を解析するルール群から構成されるプログラムであり、その情報はシステムの利用者が提供する。

問題の分析結果を提供するだけでなく、設計によっては利用者の行動を正しく導く指針を与えることもできる。

通常のプログラムとは異なった独特の構造をしている。2つの部分で構成されており、1つはそのエキスパートシステムから独立している推論エンジンであり固定である。もう1つは知識ベースで、可変である。推論エンジンが知識ベースを使って推論を行う。

80年代になると、利用者とやりとりするための対話インタフェースが第3の部分として登場した[13]。利用者との会話によって知識ベースを構築することから、後に会話型 (en:Conversational Programming System) と呼ばれるようになった。


推論エンジン(inference engine)とは、知識ベースから答えを導き出す仕組みである。
エキスパートシステムの頭脳であり、知識ベース内の情報を元に推論を実行する方法を提供し、結論を導く。

知識ベース(knowledge base)はナレッジマネジメントのための特殊なデータベースであり、KBと略記されることもある。
それは知識の検索を可能とし、知識を組織化し、知識をコンピュータ上に集合させたものである。

【 第5世代コンピュータ とは? 】

( 以下、上記 オンライン講義スライドより転載 )

1.png

第五世代コンピュータ(だいごせだい-)とは、通商産業省(現経済産業省)が1982年に立ち上げた国家プロジェクトの開発目標である。570億円を費やし、1992年に終結した。

概要

1980年代に入り、日本のコンピュータ産業は輸出も増え、市場規模も2兆円まで成長した。
従来、通産省は1983年ごろまで貿易自由化対策としてコンピュータ企業への助成金を出していたが、既にそのような直接的な助成金は意義を失っていた。また、海外からもIBM互換機を輸出する日本に対して風当たりが強くなっていた時期でもある(IBM産業スパイ事件が起きたのは1982年)。

そこで、次は第四世代と言われていた時代に、あえて更に先の第五世代コンピュータを開発するプロジェクトを立ち上げ、日本の独自性を打ち出そうとした。

この検討が開始されたのが1979年である。
当時、電子技術総合研究所(現在の産業技術総合研究所)の渕一博らは述語論理によるプログラミングに強い関心を持っていた。

渕らは独創性を求めるこのプロジェクトを絶好の機会として働きかけ、第五世代コンピュータの目標は「述語論理による推論を高速実行する並列推論マシンとそのオペレーティングシステムを構築する」というものになった。

当初の予定から1年延びた1992年、プロジェクトは「当初の目標を達成した」として完了した。

影響と批判

1981年、第五世代コンピュータに関する国際会議が通産省主導で開催された。
ここで、通産省側は八方美人的に野心的な目標をいくつも掲げた。「人工知能が人間知能(人間脳)を越えること」すなわち人間の脳は高速処理や大量処理には向いていないので、それを越える人工知能をつくることが目標と説明された。
その代表的な例が、エキスパートシステム である。

たとえば、医学の診断や、多様な場合分けに対応する高速な機械制御など。特に期待されたのは、自然言語処理である。正確な機械翻訳や、高度な言語理解を通じた専門的判断など。

これは主に予算獲得のためであった。渕一博は一貫して並列推論マシンの開発が目標であると明言している。渕はプラットフォームが高性能化すれば自然にその応用が出てくると考えていた。

しかし、通産省の説明にアメリカの人工知能学者エドワード・ファイゲンバウムらが興味を示し、欧米の危機感を煽り立てた。

当時の欧米の受け取り方は「日本が官民一体で高度な人工知能マシンを開発しようとしている」というものだった。また、朝日新聞などのマスコミも大々的に取り上げた。

しかしながら、実際に大量の資金が投じられて完成したのはアプリケーションのほとんどない並列推論システムだけだった。10年と570億円をかけたプロジェクトは、通産省が喧伝した目標についてはまったく達成しなかった。「本来の目標については達成した」としているが、しかし成果が産業に影響を与えることはほとんどなかった。
単に、学術振興と人材育成に寄与しただけだったと言えよう。

IDC社の William Zachman は「The Japanese Give Up on New Wave of Computers」(International Tribune、東京版、1992年6月2日)で次のように述べている。

AI型の応用の進展を阻んでいるのは、十分な知性を持った AI ソフトウェアが存在しないからであって、強力な推論マシンがないからではない。
AI型の応用が既にたくさんあって、第五世代コンピュータのような強力な推論エンジンの出現を待ちわびていると思うのは間違いだ。

また、ファイゲンバウムの談話として同じ記事で以下のように述べられている。

第5世代は、一般市場向けの応用がなく、失敗に終わった。金をかけてパーティを開いたが、客が誰も来なかったようなもので、日本のメーカはこのプロジェクトを受け入れなかった。技術面では本当に成功したのに、画期的な応用を創造しなかったからだ。


2. Watsonの自然言語データ処理の流れ

2016/06/27 に公開

Watsonは、人間の専門家が十分な情報に基づいたよりよい意思決定ができるようにサポートしてくれます。

なぜWatson は非常に複雑な状況に関する質問にもいつでも応答して、証拠に裏付けられた、さまざまな潜在的な応答や推奨を提供できるのでしょうか?
「がん」という用語を例にとってみてみましょう。

( 以下、上記 IBM公式チャンネル YouTube動画 より 一部抜粋して転載 )

スクリーンショット 2016-08-14 14.18.07.png

スクリーンショット 2016-08-14 14.18.18.png

スクリーンショット 2016-08-14 14.19.16.png

スクリーンショット 2016-08-14 14.19.24.png

スクリーンショット 2016-08-14 14.19.33.png

スクリーンショット 2016-08-14 14.19.47.png

スクリーンショット 2016-08-14 14.19.59.png

スクリーンショット 2016-08-14 14.20.06.png

スクリーンショット 2016-08-14 14.20.15.png

スクリーンショット 2016-08-14 14.20.21.png

スクリーンショット 2016-08-14 14.20.28.png

スクリーンショット 2016-08-14 14.20.35.png

スクリーンショット 2016-08-14 14.20.42.png

スクリーンショット 2016-08-14 14.20.49.png

スクリーンショット 2016-08-14 14.20.57.png

スクリーンショット 2016-08-14 14.21.12.png

スクリーンショット 2016-08-14 14.21.20.png

スクリーンショット 2016-08-14 14.21.28.png

スクリーンショット 2016-08-14 14.21.34.png

スクリーンショット 2016-08-14 14.21.54.png

スクリーンショット 2016-08-14 14.22.02.png

スクリーンショット 2016-08-14 14.22.08.png

スクリーンショット 2016-08-14 14.22.21.png

スクリーンショット 2016-08-14 14.22.27.png

スクリーンショット 2016-08-14 14.22.34.png

スクリーンショット 2016-08-14 14.22.39.png

スクリーンショット 2016-08-14 14.22.47.png

スクリーンショット 2016-08-14 14.22.54.png

スクリーンショット 2016-08-14 14.23.08.png

スクリーンショット 2016-08-14 14.23.16.png

スクリーンショット 2016-08-14 14.23.25.png

スクリーンショット 2016-08-14 14.23.32.png

スクリーンショット 2016-08-14 14.23.38.png

スクリーンショット 2016-08-14 14.23.45.png

スクリーンショット 2016-08-14 14.23.53.png

スクリーンショット 2016-08-14 14.24.00.png

スクリーンショット 2016-08-14 14.24.08.png

スクリーンショット 2016-08-14 14.24.18.png

スクリーンショット 2016-08-14 14.24.26.png

スクリーンショット 2016-08-14 14.24.32.png

スクリーンショット 2016-08-14 14.24.43.png

スクリーンショット 2016-08-14 14.24.51.png

スクリーンショット 2016-08-14 14.25.30.png

スクリーンショット 2016-08-14 14.25.39.png

スクリーンショット 2016-08-14 14.25.46.png

スクリーンショット 2016-08-14 14.25.55.png

スクリーンショット 2016-08-14 14.26.15.png

スクリーンショット 2016-08-14 14.26.26.png

スクリーンショット 2016-08-14 14.26.34.png

スクリーンショット 2016-08-14 14.26.40.png

2016/06/27 に公開

Watson は私たちが多彩な分野で専門知識を共有する方法に、革命的な変化を与えています。Watson はあなたをどのようにしてよりよい専門家にするのでしょう。

スクリーンショット 2016-08-14 14.50.30.png

スクリーンショット 2016-08-14 14.50.38.png

スクリーンショット 2016-08-14 14.50.46.png

スクリーンショット 2016-08-14 14.50.53.png

スクリーンショット 2016-08-14 14.51.00.png

スクリーンショット 2016-08-14 14.51.08.png

スクリーンショット 2016-08-14 14.51.14.png

スクリーンショット 2016-08-14 14.51.29.png

スクリーンショット 2016-08-14 14.51.34.png

スクリーンショット 2016-08-14 14.51.41.png

スクリーンショット 2016-08-14 14.51.48.png

スクリーンショット 2016-08-14 14.51.55.png

スクリーンショット 2016-08-14 14.52.03.png

スクリーンショット 2016-08-14 14.52.11.png

スクリーンショット 2016-08-14 14.52.17.png

スクリーンショット 2016-08-14 14.52.23.png

スクリーンショット 2016-08-14 14.52.28.png

スクリーンショット 2016-08-14 14.52.34.png

スクリーンショット 2016-08-14 14.52.41.png

スクリーンショット 2016-08-14 14.52.46.png

スクリーンショット 2016-08-14 14.52.53.png

スクリーンショット 2016-08-14 14.53.00.png

スクリーンショット 2016-08-14 14.53.07.png

スクリーンショット 2016-08-14 14.53.15.png

スクリーンショット 2016-08-14 14.53.21.png

スクリーンショット 2016-08-14 14.53.28.png

スクリーンショット 2016-08-14 14.53.35.png

スクリーンショット 2016-08-14 14.53.43.png

スクリーンショット 2016-08-14 14.53.51.png

スクリーンショット 2016-08-14 14.54.01.png

スクリーンショット 2016-08-14 14.54.04.png

スクリーンショット 2016-08-14 14.54.10.png

スクリーンショット 2016-08-14 14.54.16.png

スクリーンショット 2016-08-14 14.54.24.png

スクリーンショット 2016-08-14 14.54.32.png

スクリーンショット 2016-08-14 14.54.49.png

スクリーンショット 2016-08-14 14.54.56.png

スクリーンショット 2016-08-14 14.55.03.png


2014/10/07 に公開

Learn how IBM Watson works and has similar thought processes to a human.

( 以下、上記 IBM公式チャンネル YouTube動画 より 一部抜粋して転載 )

スクリーンショット 2016-08-14 13.58.53.png

スクリーンショット 2016-08-14 13.58.40.png

スクリーンショット 2016-08-14 13.58.03.png

スクリーンショット 2016-08-14 14.08.14.png

スクリーンショット 2016-08-14 14.08.25.png

スクリーンショット 2016-08-14 14.08.33.png


IBM Watson は、自然言語処理と機械学習を使用して、大量の非構造化データから洞察を明らかにするテクノロジー・プラットフォームです。


3. Watson アプリを自分でも作ってみるには?

(Watsonアプリ開発環境 & 作成コード事例)

IBM Watson Developer Cloud

The Watson Developer Cloud offers a variety of services for building cognitive apps.
Click a service to take your first step into the cognitive era.

Watson on Bluemix

Pepperくんから IBM Watson にアクセスして動くアプリをつくる方法

G-angleさん Qiita記事 (2015/08/06)「ChoregrapheからWatsonを使用してみる」

( 関連 )

Bluemixとは? ~IBMが提供するクラウド環境(PaaS)の名前で、多様なアプリケーションを構築・管理・実行するあための開発環境

Hubotとは? ~ GitHub社製のチャットbot開発・実行フレームワーク


4. 産業界における Watson 活用事例


【 参考 】



【 書籍 】1990年代や80年代の古い出版年の本が多い