前回、MITの論文、「AIとHCI」をまとめたところ、viewが80近くもあり、みなさん、このテーマで関心があることを実感しました。
今日は、スタンフォード大学の Winograd教授の2006年の論文です。前回の、MITと類似している部分もありますが、そうでない部分もありますね。
この論文は、AIコミュニティとHCIコミュニティは、人間とコンピュータがどのように相互作用すべきかについて、しばしば相反する見解を持っているとされてきたが、AIとHCIの発展に伴い、知識とデザインの関係をどのように考えるかという点で、両コミュニティを横断する深いコントラストが生まれてきている。両分野の研究の根底にある合理主義とデザインの方向性を検証することで、コンピュータとの効果的なインタラクションのための相違点と可能性を明らかにする内容です。
==> 合理主義について以下、注釈を入れておきます。
[合理主義と経験主義のはざまで]2012 マイクロソフト研究所アジア 辻井潤一より引用
「人間の思考過程が理解できていないから、人工知能が実現していない。理解できていれば、その理解をプログラムで実現することで人工知能を実現できる。合理的な理解とその理解の人工物による実現とを近づけて考える。知能や思考の過程をプログラム化していく、すなわち、計算過程として捉えようとすること。」
シリコンバレー、スタンフォード大学、遡って1962年頃の話。
McCarthy氏は、スタンフォード大学に着任する前に、AI研究者の標準となったLISPプログラミング言語を発明し、インテラクティブ・コンピューティングの基礎となった時間共有型オペレーティングシステム(time-shared operating systems)の先駆者となっていた。McCarthy氏は、基本的に10年以内に実用的な人工知能を開発するという考えを持っていた。いわゆる「スーパーブレイン(superbrain)」のようなものである。
一方、Engelbart氏は、このアプローチに哲学的に反対していた。Engelbart氏のアイデアは、「増強(augmentation)」と呼ばれ、ループの中に人間を置き換えるのではなく、コンピュータの助けを借りて人間を増強するというものであった。
そのため、McCarthy氏とEngelbart氏には、哲学的な相違があった。
ここ数十年は、一方が冬の時代を迎えると、片方のアプローチが盛り上がる、そのサイクルが交互に繰り返されてきたみたいです。
アップルが初期に発表したナレッジ・ナビゲーター(Knowledge Navigator)のビジョンで説得力を持って描かれていたように、人間と同じようにコンピュータと付き合うことができるのか?
or
人間の属性や能力をコンピュータに帰属させることを人々に奨励することに対して、実用上、さらには哲学上において、異議や反対意見はあるのか?
==> ここで、ナレッジ・ナビゲーター(Knowledge Navigator)について、注釈を入れます。
「元AppleのCEO John Sculley氏 (Steve Jobsを追い出した方です)、1987年に打ち出した未来のパソコンのコンセプトのこと。
Macが誕生してわずか3年後のこと。タッチスクリーンやデジタルカメラ、自然言語インターフェイスなどを搭載した携帯情報端末で、ラップトップコンピュータすら登場していなかった当時の技術力では実現不可能な夢のコンセプト。人工知能(AI)を備え、ユーザーが話しかけると音声で応答して情報の検索や処理、例えば予約などをこなす、折りたたみ可能なモバイルデバイス。Sculley氏は、ナレッジナビゲーター構想の実現の一歩として "Newton" というPDAの開発プロジェクトを起ち上げる。 "Newton" は将来を期待されていましたがビジネスとしては奮わず、10 年振りにApple社に復帰したJobs氏によりプロジェクトは閉鎖された。」
筆者(Winograd教授)自身の歴史は、この溝を越えたシフトを反映していると見ることができる。最初はAIの中核分野での仕事をしていたが、その後、AIのアプローチを拒否して、HCIに移った。HCI分野の他の多くの人々と同様に、筆者自身もこのことを、コンピュータを使って何をするのが最も効果的かということについて、競合する哲学の間での戦いだと考えたことがある。
このような場合、"どちらも正しい "と穏便に済ませてしまうのは簡単。コンピュータが日常生活の一部になるにつれ、AIを適用できる場所と、他のスタイルのインタラクションが適している場所が明らかになってくる。AIは、オンラインストアのレコメンドインターフェースなど、多くのインターフェースのキーテクノロジーとなっている。20年前のKnowledge Navigatorでも、AIエージェントであるPhilとの自然な対話と、地図やグラフィックなどの画面上のオブジェクトを直接ジェスチャーで操作することで、ダイナミックな魅力を表現していた。
AIとHCIという単純な対立では見えてこない、もっと深い区分がある。それは、人間を理解し、その利益のために技術を創造する方法に対する2つの異なるアプローチの対比である。
<合理主義的アプローチとデザイン的アプローチ>
第一のアプローチ:
著者が呼ぶ「合理主義」: 人間を認知機械としてモデル化し、その内部メカニズムはデジタルコンピュータに組み込まれたものと同じであるとするもの。
合理主義的なアプローチの主な前提は、思考の本質的な側面を形式的な記号表現で捉えることができるということ。
形式的な論理に直接対応しているかどうかにかかわらず、記号構造の形でモデル(プロセスや知識)に明確に定義されたアルゴリズムのルールを適用できるという点で、論理のように動作する。この論理があれば、知的なプログラムを作ることができ、人間のインタラクションを最適化するシステムを設計することができる。
2つ目のアプローチは、レッテルを貼るのが難しい。
「現象学的」「構造主義的」「生態学的」などと呼ばれる人たちと親和性があるが、ここでは「デザイン」アプローチと呼ぶことにする。
デザインアプローチでは、知的な内部構造のモデル化ではなく、人とそれを取り巻く環境との相互作用に焦点を当てる。
デザインでは、人間の解釈や行動の領域で、予測モデルがないものを扱うことがよくある。デザインは、人間の解釈や行動を予測するモデルを持たない分野で行われることが多く、「うまくいくか」という問題は、建設前の計算ではなく、プロトタイプのテストと改良を繰り返すプロセスとしてアプローチされる。
現実の人間世界の複雑さを知り、モデル化することには限界があることを認めている
HCIコミュニティでは、認知工学的なアプローチから、他のデザイン分野の経験をより多く取り入れたデザイン指向のスタンスへと進行してきた。新しいインターフェイスを作成し、人々がそれらと相互作用する方法を理解する上での分析とデザインの役割について、継続的な議論が行われている。もちろん、「デザイン」は人によって様々な関連性のある、しかし同一ではない方法で解釈される。HCIとデザインという言葉をウェブで検索すると、議論の多様性と活気を感じることができる。
同じ時期に、AIも同じような軌跡をたどってきた統計的アプローチ、体現的アプローチ、構成主義的アプローチが台頭してきている。これらの重要なコンセプトや違いを短いコメントで表現することはできないが、これらのアプローチには、以下のような共通点がある。
AIの能力を、設定の論理的表現やエージェントの知識に基づいて決定するのではなく、一般的な適応メカニズムと世界の経験との相互作用があり、それが時間の経過とともに知的な行動につながり、多くの場合、広範な例や訓練の結果として得られる。
多くのAI批判者は、人間の思考と人間の物理的な体現とが不可分であることを強調してきた。人間らしい思考とは、単に脳の構造や遺伝子の配列が正しいかどうかという問題ではなく、生物全体と、他の人々を含む環境との間の複雑な発達的相互作用の問題である。彼や他の人々は、デバイスが人間のような知性を持つためには、そのデバイスが人間の発達や養育に似た経験をする必要があると主張している。これに対する合理主義的な反応は、物理的世界の経験の最終結果を命題の集合体で再現することであるが、このプロジェクトは長年の努力の末に期待に応えることができなかった。
もちろん、適応のメカニズムを作り、理解するためには、合理的なアプローチが大きな役割を果たす。統計的言語理解、ニューラルネットワーク、機械学習などの研究では、適応の基盤となるさまざまなメカニズムやテクニックを深く分析し、定量的なモデルを作成している。しかし、研究者は知的システムの知識や行動のルールを明示的に表現する必要はない。
<結論>
では、HCIとAIの違いではなく、合理的なアプローチとデザイン的なアプローチの違いが根本にあるとすれば、新たな落としどころはどこにあるのか。
著者は明らかにデザインの視点に親近感を持っているが、この場合もどちらか一方の立場を取るのは愚かなこと。デザインアプローチの影響が大きくなってきたのは、20世紀半ばの純粋な科学技術の進歩に伴い、コンピュータのメタファーを現実のすべてに押し付けようとする合理主義的なアプローチが過大評価されてきたことへの対応である。これは必要な是正措置であった部品が、すべての是正措置と同様、反対のものを否定するものではない。
学際的なデザインプログラムでは、「T字型」の理解と仕事の進め方を生み出す必要があると話している。T字型の縦棒は、科学技術分野の深い分析的理解を表しています。横棒は、分析の限界を認識し、人間の状況の不可避な複雑さと混乱を伴う問題領域で効果的に働く能力を開発しながら、デザイン思考を全体的な方法で問題に持ち込む能力です。T字型AIやT字型HCIも必要なのです。驚くほど似ているかもしれませんね。
=> 前回の、東のMITの論文同様、西のスタンフォード大学においても、AIとHCIは共存がキーワードになってきているように感じます。また、実際、当社で行っているプロジェクトも、AIの限界とHCIの領域でカバーして、全体としては(顧客の要望を)実現しつつあります。AI開発の事業、経営を丸5年、AIはAIとして発揮してもらいながら、私は、ややデザイン志向に傾きつつ、でも、もちろん、共存しており、機械学習のエンジニアと一緒に働いている訳ですので、そのあたりも。まさしく、コラボレーションですね。
また、面白い論文は、シェアするようにします。掲載する限り、注釈を入れたり、せっかくなので、特にエンジニアの方に読んで頂きたいと思っていますので、丁寧に説明することを心掛けます。このあたりの領域に関心のある方、一緒にお客さんのAIプロジェクトを進めていきたいと思っております。