こんにちは。プロダクト開発本部の飯塚です。
6/6から6/9に開催された、2023年度 人工知能学会全国大会(JSAI 2023)を聴講しました。大会開催地は熊本(熊本城ホール)で、最新のAI研究✨とおいしい馬刺し🥩をインプットできた有意義な機会となりました。
聴講したものの中で興味を持った発表3つを紹介いたします。
泉 諒音、神野 健哉 - 画像生成モデルを用いたSentence-BERTの文ベクトルと調査
Sentence-BERTが生成する文ベクトルの性質や特徴を分析した研究です。Sentence-BERTはBERTをファインチューニングしたモデルで、入力された文に対して、その文の文脈をとらえた文ベクトル(分散表現)を生成します。この研究では「Sentence-BERTによる文ベクトルから画像を生成するデコーダモデル」を利用して文ベクトルを分析しており、ユニークで面白いと感じました。この研究では「青のタント」のような「色+車種」形式のテキストとそれに対応する画像を用いていて、文ベクトルにおいて「色」を表している次元はどこかを探すアイデアや実験をまとめていました。実験の結果、文ベクトルの各次元の役割は完全に分断されているわけではないものの、各次元で表現される情報に違いがあることが確認されました。
自身が大学院でテキストの解きほぐし(distanglement)とスタイル変換に関して扱っていたことから、この研究に興味を持ちました。こういった研究(潜在表現の可視化)は説明可能なAIの開発に貢献する技術だと思うので、今後実務にAIが導入されるにあたって重要な役割を持つようになると思います。
瀬川 修 - 論文テキストを知識源とした情報推薦
キーワードから関連する論文タイトルや技術を提示する情報推薦に関する研究です。Sentence-BERTを用いて検索キーワードから「質問ベクトル」、論文タイトルと要旨から「論文ベクトル」を生成し、「質問ベクトル」に類似する「論文ベクトル」を探すことで、検索キーワードに対する情報推薦を行います。また、数語のキーワードによる「質問ベクトル」では不十分な検索結果が得られたことから、論文タイトルと要旨から生成した500語程度のテキストにキーワードを拡張し、「質問ベクトル」を生成させました。この質問拡張の結果、比較的内容が妥当な論文がヒットしたそうです。また、この研究では論文の重要情報を抽出する際にXMLの構造情報を活用しています。
私はpdfやXML、HTMLの構造情報を使うことはドキュメントを効率的に処理することに対してとても有益であると思います。人間も文字の大きさや色、箇条書き、表などの単なる文字情報だけでなく、構造情報も駆使して、効率的にドキュメントを読み書きしています。そのため、その構造情報をAIが活用することも自然な発想であると思います。
※この研究ではデータセット作成において構造情報を活用しており、モデル自体に構造情報を学習させているわけではありません。
中川 裕志、武田 英明、大屋 雄裕、高橋 未玲 - アートにおいても敗北しつつある人間〜人の美意識もAIにハックされるのか?〜
生成AIの発展に伴い、AIのビジネスへの活用が活発化してきました。また、著作権・教育活用・悪用の問題点の整理も進んできています。このセッションではAI×アートをテーマに、倫理や権利、アートにおけるAIの存在について議論が行われました。
まずAIの倫理に関して、AIによってイラストレーターの仕事がなくなる!?といった話題について、「写真の登場」「産業革命」においても同じようなことが言われていたという話が興味深く感じました。新たなテクノロジーに人間が職を奪われることは、今に始まったことではない、とのことです。ただこれまでと異なるのは、AIによる影響力はインターネットを介して広範囲に、瞬く間に広まっていくということだと思います。AIの安全性を特に敏感に意識しなくてはならないと改めて感じました。
また、AIの権利については、AIを実際にビジネスに活用している私たちにとって、敏感に捉えるべきテーマだと感じます。AIの利用者、プロンプトエンジニアはプロデューサーの立場に似ているといった話に納得がいきました。プロデュースをアイデアととらえた場合、著作権法ではアイデアは保護対象とはならないので、プロデュースも保護対象とならない、となってしまうのだそうです。また、こういった問題は映画製作者に対しても考えられてきたことで、著作権法とは別に利益分配するシステムを設けることで解決されてきたそうです。インサイトテクノロジーにもAIを扱った製品(Insight Governor、Insight Data Masking)がありますが、それらは製品のシステムの一部にAIを組み込んでいる、といった形です。今後、「製品やその開発」におけるAIの機能が占める割合が拡大していくと、弊社においても AIの権利に関する議論をさらに活発に行う必要が出てくるかもしれません。今後もデータセットやモデルなどの著作権の侵害には細心の注意を払いたいと改めて思いました。
おわりに
JSAI2023では、AIの最新技術のみならず、権利や倫理、安全性についても学ぶことができました。そして、何より、私自身もAIを活用した魅力的なテクノロジーを生み出せるようなエンジニアに成長したい😊と改めて思いました。
最後に、大会運営に携わった皆様に感謝申し上げます。