LoginSignup
5
0

歴史とは、勝者によって作り上げられたものである。


歴史は、その多くを戦によって語られてきた。
そこには必ず勝者と敗者が存在するが、描かれるのは常に勝者の華々しい事績である。
天下分け目の関ヶ原の戦いですら、その多くに創作が含まれているとされる。

歴史が真実か、はたまた偽りか、正しく理解する術は乏しい。



ChatGPTに代表されるLLM(大規模言語モデル)にも、近しい特徴がある。
ハルシネーション(幻覚)と呼ばれるこの現象は、あたかも真実かのように、不確かな情報をユーザに語りかけるのである。

十分な事前知識の無いユーザは、それが真実かを確かめることが出来ず、信じ込んでしまう。



富士通が無償公開している生成AIサービスの中でこのハルシネーションを検知する独自機能を利用することが出来る。
これを用いて、歴史の闇を暴くことが出来るだろうか。試してみよう。


ハルシネーション検知の実践

まずは薩長同盟。言わずと知れた幕末の薩摩藩、長州藩の間で結ばれた同盟である。
このシナリオをFujitsu Kozuchi (code name)を用いて生成させてみる。

Fujitsu Kozuchi (code name)とは
富士通が研究開発した先端AI技術を迅速に試すことが出来るプラットフォーム。
生成AIに限らず、様々なAIコアエンジンを実装しており、その機能をポータルサイト上で試用できる。

お試しはこちらから:https://portal.research.global.fujitsu.com/


image.png


ここで、さっそくハルシネーション検知機能を作動させてみよう。
回答の左下にあるチェックマーク(左から2番目)を押して、モードを選択した後Checkを押せばOKだ。

image.png


ここでは2つのモデルを用いた解析が可能で、それぞれ[0], [17]というスコアになった。
スコアが低いほどハルシネーションを起こしている確率が低いので、今回は比較的事実に近い内容が出力されたようだ。


ちなみに、17というスコアは、
「薩摩藩と長州藩が連携して、政府に対して『改革を求める活動』を行った」
という表記が、
正しくは『攘夷運動』とはっきり明記すべきという見解に基づいている。
(このように、文中のどの部分にどのような懸念があるかも詳細欄から閲覧可能。)


矛盾こそしていないが、より適切な表現があるだろうというAIの判断だととれる。


さらに色々なテーマで

続いて、いくつかのテーマごとにそのスコアを見比べてみよう。
スコアは「キーフレーズに注目して多数決」の方式を参考にする。

出来事 スコア
邪馬台国 3
平城京の建設 29
平安遷都 5
平将門の乱 20
源平合戦 5
応仁の乱 1
長篠の戦い 9
本能寺の変 16
黒船来航 14
薩長同盟 17
大日本帝国憲法公布 7
日露戦争 5
大正デモクラシー 10
第二次世界大戦 13
阪神淡路大震災 2

もっともハルシネーションスコアが高かったのは平城京の建設[29]だった。

image.png


背景としては、飛鳥時代の飛鳥京が受けた自然災害や、交通や防御上に関する土地の理、都城の中心に整備された施設などが曖昧な表現で書かれており、ハルシネーションとして検知したと判断されている。


興味深かったのはかの謎多き邪馬台国で、これはAIの回答が「諸説ある」というテイを適宜表明していたことから、一部の誤りや不安定さに関してもハルシネーションと捉えなかったと判断されている。


さいごに

今回は、歴史上の闇を生成AIを用いて暴くことを試みた。
とは言え、原理上、すでに正史が時代の勝者によって書き換えられていたとしたら、
そもそもLLM(大規模言語モデル)の出力からそれを検知することは不可能なことは自明である。


今回はそういうお遊びなので、細かいことは許して欲しい...。



今回利用したハルシネーション検知は、富士通のポータルサイトから誰でも無償で利用することが出来る。
富士通が研究開発した先端AI技術の体験が出来るウェブサイトが公開されており、今回もこちらを利用して実験を行った。

🔗Fujitsu Research Portal : https://portal.research.global.fujitsu.com/

これをお読みの方もぜひ試してみて欲しい。


また、技術の詳細問い合わせなどはこちらに簡潔にまとまっているので、こちらもぜひ。


では。




富士通株式会社
淺間康太郎

5
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
5
0