知識表現
人工無脳
人工無脳は,特定のルール・手順に沿って会話を機械的に処理するコンピュータプログラム.
チャットボットやおしゃべりボットなどと呼ばれている.
最初の人工無脳はジョゼフ・ワイゼンバウムによって1964年から1966年にかけてと開発されたELIZAと呼ばれるプログラム.
エキスパートシステム
専門分野の知識を有し,エキスパートのように振る舞うプログラムをエキスパートシステムと呼ぶ.
初期のエキスパートシステムとして最も影響力が大きかったのが1970年代にスタンフォード大学で開発されたMYCIN.
血液中のバクテリアの診断支援をするルールベースのプログラムで,69%の確率で正しい処方をすることができており,これは,専門医ではない医師より良いとされる数字.
専門家の知識を扱っていることがわかりやすい医療分野で,医師と対話しているような質問応答機能や説明機能を備えていたことで大きな注目を集めた.
同大学のエドワード・ファイゲンバウムは1960年代に未知の有機化合物を特定するDENDRALを開発していた.
エキスパートシステムの限界
知識ベースを構築するためには,専門家やドキュメント,事例などから知識を獲得する必要があるが,専門家の持つ知識の多くは経験的なものであったため,専門家からの知識の獲得が困難であった(おそらく,専門家は自分の経験で獲得したものだから,その知識を明示的に体系化して他人に渡すのを嫌がったから,専門家から知識を得ることが出来なかったという意味).
また,知識の数が増えると,一貫していないものが出てきて,知識ベースを保守することが困難になった.
そのため,別のアプローチに目を向け始めた.
意味ネットワーク
意味ネットワークはもともと認知心理学における長期記憶の構造モデルとして考案されたもの.
概念をラベルのついたノードで表現し,概念間の関係をラベルのついたリンクで結んだネットワーク.
「is-a」は継承関係を表現しており,この関係が重要.矢印が向いている方が上位概念,つまり内包している.図のように,哺乳類は人間を内包している.また,「part-of」などは属性を表現している.
オントロジー
Cycプロジェクト
知識ベースのシステムが柔軟な能力を持つには膨大な知識が必要になる.
そのため,すべての一般常識をコンピュータに取り込むというCycプロジェクトがダグラス・レナートによって1984年からスタート.
2014年8月で30年に突入したプロジェクトでおそらく現在もなお続いている.
オントロジー
知識の記述や共有が難しいことが分かり,知識を体系化する方法論が研究されるようになる.
オントロジーとは,本来哲学用語で「存在論(存在に関する体系的理論)」という意味.人工知能の用語としては,一般的に「概念化の明示的な使用」という定義で知られる.
エキスパートシステムのための知識ベースの開発と保守にはコストがかかるという問題があるため,それを解決するために知識の共有と再利用に貢献する学問として知識工学が注目され,その中の中心的な研究としてオントロジーが特にフォーカスされた.
結局オントロジーが何かと言うと,知識を記述するときに,その言葉の意味や関係性を他の人と共有できるように,明確に定義しておくこと.
オントロジーには,ヘビーウェイトオントロジーとライトウェイトオントロジーという2つの分類がある.
・ヘビーウェイトオントロジー:構成要素や意味的関係の正当性について哲学的な考察が必要になり,人間が関わる部分が多く,時間とコストがかかる.
・ライトウェイトオントロジー:完全に正しくなくても使えれば良いという現実的思想.ウェブマイニングやデータマイニングに適用されている.
実際の活用例として,IBMが開発した「ワトソン」にウィキペディアの情報を元にライトウェイトオントロジーが使用されている.ワトソンはアメリカのクイズ番組に出演し,人間のチャンピオンに勝利したことで有名になった.ワトソンは質問に含まれるキーワードと関連しそうな答えを高速で検索し,一番確率の高い物を解答する.
日本でも「東ロボくん」に使用されている.