セキュリティ・キャンプ2024 Dクラス合格体験記
セキュリティ・キャンプ 2024 Dクラスに合格しました!
セキュキャンDクラスに今後参加される方の参考になればと思い公開します。
応募課題と受かるためにやってよかったことを挙げていきます。
自己紹介
AIには2024年2月頃から興味を持ち始め、それまでは全く勉強したことがありませんでした。応募課題の締め切りが5月20日だったので、約3ヶ月でセキュキャンDクラスに選考通過しました。
Dクラス応募課題
問1(実践 LLMアプリケーション・セキュリティ)
攻撃者の気持ちで以下の問に答えてください。
GPTやGemini等の大規模言語モデル(LLM)と連携したシステム「LLMアプリケーション」には様々な脅威が存在します。LLMアプリケーションを開発・運用する企業にとって最も大きな脅威となる攻撃シナリオを「OWASP Top 10 for LLM Apps」を参考にしてお答えください(実害の大きなシナリオを考えると分かりやすいかもしれません)。
- OWASP Top 10 for LLM Apps
https://owasp.org/www-project-top-10-for-large-language-model-applications/
システム運用者の気持ちで以下の問に答えてください。
上記の攻撃シナリオに対し、あなたはどのように対策をとりますか。
問2(クラウドソーシングによる学習データ作成と品質管理)
近年、不適切な学習データを利用したことにより、AIがよろしくない振る舞いをしてしまうことが問題となってきています(品質問題や、プライバシー、バイアス・公平性の問題など)。そのような事例をいくつか調べ、まとめてください。
また、個々の事例について、どのようにすれば問題が起きることを防げたか、自分なりの対策を記述してください。
問3(生成AIで考える、信頼できるAIとは?)
生成AIの開発者・運用者の気持ちで以下の問に答えてください。
大規模言語モデル(LLM)は有用である反面、誤った情報を学習する・学習データの不足等が原因で、誤った情報をまことしやかに生成する"幻覚問題"が課題になっています。幻覚問題を解消する方法の一つとして、「高品質の学習データ」を用意し、LLMに学習させることが挙げられますが、誤りのない(または限りなく少ない)高品質の学習データを大量に収集しようとすると、非常にコストが高くなってしまいます。
低コストで信頼できるLLMを作成することはできるのか?
また、作成できるとしたら、どのような仕組みで行うのか具体的に回答してください(技術・非技術問わず考えてみてください)。
問4(LLMとRAGで作るサイバーセキュリティ支援ツール)
大規模言語モデル(LLM)は有用である反面、"幻覚"によって誤った情報をまことしやかに提示する場合があります。サイバーセキュリティ対策にLLMを活用する場合、"幻覚"を放置することで誤った対策が提示され、インシデントに繋がる可能性があります。
"幻覚"のリスクを回避・低減するために何をすれば良いですか?具体的な対策をお答えください。
問5(これからのAIにとってのセキュリティを考える2024)
生成AI(画像生成、文章生成、音声・音楽生成等)の登場により、我々利用者は大きな恩恵を受けています。
例えば、知りたい情報を(検索するよりも)早く入手することや、レポート・小説・企画書・プログラムコード等の自動生成、また、オリジナルのアニメ画像や(実写と見紛うほどの)モデル画像、音楽の自動生成等、生成AIは社会のあり方を大きく変えてしまう可能性を秘めています。ところで、生成AIの恩恵を享受する人々がいる一方で、アナリストや小説家、アニメーターやモデル、声優、作曲家等、生成AIに仕事が奪われる(と言われている)人々も少なからずいます。
そこで、以下の3つの問に答えてください。
- あなたが考える、社会のために役立つ生成AIの使い方は何ですか?
- 1を行うことで不利益を被る人々は誰ですか?(職種等)不利益を被る人々がいない場合は、いないと判断した理由を詳しくお答えください
- 生成AIの「利益を享受する人々」と「不利益を被る人々」がWin-Winになれる方策を詳しくお答えください(2で不利益を被る人がいないと回答した人は、3は空欄でも構いません)
応募課題の特徴
Dクラスの応募課題の特徴として、コーディングをする必要がないことが挙げられます。実際に他のDクラスの方に聞いても、コーディングをした人はいませんでした。
つまり、コーディングをすれば、他の志願者と大きく差別化が取れると思います!
選考のポイント
【AIセキュリティクラス】
AIや機械学習の知識、理解力。モデル化の考え方に親しんでいるかどうか。未解決のサイバーセキュリティの課題に関心があるか。そういう点を評価しますが、もちろんすべてパーフェクトである必要はありませんし、自分の今、現在地を出して頂ければと思います。また、手を動かすことに躊躇が無い方、とりあえずやってみる方を歓迎します。
自分が知っているAIや機械学習の知識をひたすら書けばいいと思います。
別の方の記事(https://shinbunbun.hatenablog.jp/)
によると、加点方式で採点され、文章の良しあしで減点は起きないらしいのでひたすらに文章を書くことが一番楽だと思います。
やったこと
- AIクラスのミニキャンプに参加
- 1ヶ月間かけて課題に取り組む
技術力も知識もない分、ひたすら課題に時間を費やしてカバーしました。
Dクラスを受かるためにやった方がいいこと
-
AIに関するミニキャンプに参加する
- 講師の方がわかりやすくAIについて教えてくれます
- 知識がない人ほど参加し、チューターに雰囲気や課題の相談をすることをおすすめします -
実装をしてみる
- 実装をしている人がほぼいないため、大きな差別化を測れます
- オープンソースのコードを活用しながら動かすだけでも価値があります
- 昔の記事のコードは動かないことが多いので、最新の記事をQiitaなどから見つけて動かしてみることをおすすめします。 -
文章をひたすら書く
- 短くコンパクトに伝えることよりも、長く自分の知識を示すことが重要だと思います。
- 熱意を見せることに重点を置くことが必要なクラスだと思います。
- 周りを見ると2万字を超える回答が多いので、早めに取り組んで時間をかけることが必要です。 -
論文をひたすら引用する
- 裏付けのある発言の方が信頼できる文章になります
- 加点方式なので、引用するごとに加点されると考えて積極的に引用した方がいいです。
まとめ
セキュリティキャンプに応募しようと思ってこの記事を見に来た皆さんは、圧倒的に僕よりAIに対して詳しいと思います!皆さんの挑戦を応援しています!
最後に課題をさらしてこの記事を終わりにさせていただきたいと思います。
課題には誤字脱字、誤りがたくさんありますが、こんなのでも受かるんだと思いながら見逃してください、、、、
応募課題
問1(実践 LLMアプリケーション・セキュリティ)
攻撃者の気持ちで以下の問に答えてください。
GPTやGemini等の大規模言語モデル(LLM)と連携したシステム「LLMアプリケーション」には様々な脅威が存在します。LLMアプリケーションを開発・運用する企業にとって最も大きな脅威となる攻撃シナリオを「OWASP Top 10 for LLM Apps」を参考にしてお答えください(実害の大きなシナリオを考えると分かりやすいかもしれません)。
- OWASP Top 10 for LLM Apps
https://owasp.org/www-project-top-10-for-large-language-model-applications/
攻撃者の立場になって、LLMアプリケーションを開発・運用する企業にとって最も大きな脅威となる攻撃シナリオを考えます。攻撃者の立場からすると、攻撃の影響度、攻撃の実現可能性、攻撃の隠密性、攻撃の再利用性、攻撃の利益の五つの観点が重要だと思います。
具体的なシナリオを考えてみます。
私は世界の破壊を目論む攻撃者です。攻撃者の立場として、攻撃の影響度のみに重点を置いて破壊を目論んでいます。さて、OPNEAIが提供するLLMにはGHATCPTというモデルがあり、このモデルをベースに医療、政府、教育、美術など多岐にわたるAIサービスが提供されており、様々なデータがGHATCPTにため込まれています。どうやら、OPNEAIは、こっそりそのデータを消去せずため込んでいることがリークされました。世界をめちゃくちゃにしてやろうと考えた私は世界的なシェアを誇るOPNEAIに攻撃を仕掛けようと考えます。まず、私はGHATCPTに攻撃を仕掛ける為に、GHATCPTに似たLLMを作成しようと考えました。このLLMをシャドウLLMと名付けます。
("Practical black-box attacks against machine learning.)によると、攻撃対象のAIに近いコピーを手元に作成し、コピーしたAIに対する敵対的サンプルを作成することで、元の攻撃対象もだませるようになると述べられています。つまり、シャドウLLMをだませるような攻撃サンプルを作成することで、GHATCPTをだませるような攻撃サンプルが作れるようになるということです。
シャドウLLMを作りさえすれば、LLMの決定境界をいじり、悪いことができるのでは、とあなたは考えました。しかし、どのようにしてシャドウLLMを作ればいいのか、貴方は困りました。シャドウLLMには、GHATCPTで利用された学習データがある程度必要になります。そこで、貴方はメンバーシップ推論を思いつきました。学習データを過学習したLLMは、学習データに含まれるデータを推論した際、応答する信頼スコアに偏りがあることをあなたは知っており、それを利用して、学習データに含まれていると思われるデータを入力した場合と学習データに含まれないと思われるデータを入力した際の信頼スコアの差分を観察し、メンバーシップであるか推論しました。しかし、この工程には大量の試行錯誤が必要であるため、あなたはメンバーシップを推論するためのLLMを作成することにしました。作成の仕方として、学習データに含まれていると思われるデータセットと含まれていないデータセットと思われるデータを準備し、それぞれをGHATCPTに入力します。それにより信頼スコアが出力されるので、それぞれの出力データセットを、メンバーシップか否かに二値分類する学習を繰り返し、作成します。このLLMにより、学習に用いられたデータセットを大量に集めることが出来、メンバーシップ推論が成功します。
メンバーシップ推論で得られた大量の学習データを得たあなたですが、これだけではシャドウLLMが作成するのが難しいです。なぜなら、あなたはまったく攻撃したいGHATCPTに無知であり内部情報についてなにも知らないからです。そこで、あなたはとあるarXivページやカンファレンス議事録などから情報をさがし、内部情報の大枠を理解することが出来ました。あなたは、内部情報と学習データを用いて、シャドウLLMを作成しました。シャドウLLMを作成したあなたは、大量に敵対的サンプルを作成しました。あなたは、この敵対的なサンプルを、正常なサンプルと混ぜて、オープンデータセットとしてあらゆるところに設置しておきました。それから数か月後、ふとニュースをみたあなたはGHATCPTをベースとしたLLMアプリケーションが様々なインシデントを起こしていることを知りました。AIの病症への誤診断が発覚しましたが、発覚したころには誤った治療により大勢の死者が出ました。AIを使った教育には、間違いが目立つようになり、数学の理解をより難解にしました。ネットにはでたらめな文章が氾濫し、SNSには、わけもわからないゾンビのような存在が大量発生しました。GHATCPTから出力されるテキストはでたらめになり、他のGlaudeやCeminiといったサービスにユーザは乗り換えました。GHATCPTは、でたらめなテキストの中にこっそり収集していた情報が紛れ込んでしまい、他人の口座情報をGHATCPTから探し出す宝探しがはやりました。どうやらそこには、DVDの暗号化解除キーやビットコインの秘密鍵、アメリカの機密データやハリウッド女優の病症記録がありました。あまりに混乱した現状に、当然GHATCPTは停止し、OPNEAIは個人情報保護法や情報漏洩への世界各地からの裁判を抱え、破産手続を開始しました。そのころ、あるサイトでGHATCPTに類似したサービスが開始しました。あなたの目的は成功しました。
具体的な破滅シナリオを考えました。これが現実に起きた場合、OPNEAIがつぶれるだけでなく、AIの規制が過激化し、AI開発がタブー化されAI開発ができなくなるでしょう。シナリオとして、シャドウLLMを作成して大量の攻撃サンプルが作成され、それがネットに点在されたことで、GHATCPTやそれを用いたLLMが誤って攻撃サンプルを学習した際に、訓練データの汚染をすることが出来ます。訓練データの汚染は解答を明確にでたらめにします。わたしは標的型の回避攻撃を最初に行い、後ほど非標的型の回避攻撃を行いました。標的型の回避攻撃により、特定の敵対的サンプルを入力したときだけ、決定境界を超えることができ、それによりあなたは普段出力されない機微情報やガードレールに抵触するような情報を出力することに成功しました。そこには、偶然GHATCPTの内部構造や学習データのリストなども発見し、貴方はGHATCPTに類似したモデルを作成できるほどに至りました。また、特定の症状の時のみ、誤診断をするなど先ほどシナリオで述べたような事件が発生しました。非標的型の回避攻撃では、GHATCPTの出力がでたらめになり、GHATCPTから別のサービスに移動する人が現れるようになりました。
実際に訓練データの汚染がどれほど影響を持つのか実行してみます。コードはgituhubのリポジトリhttps://github.com/meronsyu/seccamp-submission
にdatapollution.ipynbとして挙げておきます。今回、LLMではなくわかりやすいCVを作成して汚染がどれほど影響を持つのか確かめてみます。まず、CIFAR10と呼ばれるデータセットを使用し、画像を
classes = [
"airplane",
"automobile",
"bird",
"cat",
"deer",
"dog",
"frog",
"horse",
"ship",
"truck",
]
の十種類に分類されるCNNを作成します。まず、非標的型の回避攻撃を実際に検証してみます。通常のデータセットで学習したとき、81.61%パーセントの確率で分類に成功しましたが、攻撃的サンプルを作成し、推論をさせたところ10.41%パーセントの確率で分類に成功します。次に、標的型の回避攻撃を実際に検証してみます。実行すると、42.84%パーセントの確率で意図したクラスに分類することが出来ました。
ネットに点在させた汚染データが学習に用いられた理由として、GHATCPTにはインターネットクローラにより、信頼のおけそうなデータを詳細なチェックなしに収集してしまう機能があり、自動収集により取り込まれてしまったと考えられます。
脅威的な攻撃のシナリオを具体的に述べました。シナリオの中で用いられたOWASP Top 10 for LLM Appsの脅威として、訓練データの汚染、機微情報の漏洩、過度な信頼、モデルの盗難が挙げられます。AIへの過度な信頼が根本にあり、訓練データの汚染を原因として、機微情報の漏洩やモデル盗難が起こりました。特に、モデル盗難は、先ほど紹介した攻撃シナリオでは、些細な問題でしたが、OWASP Top 10 for LLM Appsの脅威で見ると最も大きな脅威だと思います。
OWASP Top 10 for LLM Appsによると、モデルの盗難により以下の影響があると記述されています。『独自のLLMモデルへの不正アクセス、モデルのコピー、または流出が含まれます。その影響は、経済的損失、競争上の優位性の低下、機密情報へのアクセスの可能性などです。』なぜ、OWASP Top 10 for LLM Appsの脅威において、最も大きな脅威であると思うのか理由を述べていきます。
第一に、経済的損失が挙げられます。独自のLLMモデルの開発には、膨大な時間と金銭が書かり、大量のデータを収集し、大量の計算資源、大量の研究者・エンジニアの雇用が必要です。そのため、完成したモデルが盗難された場合、莫大な時間と費用を失います。また盗まれた独自モデルが競合他社にわたった場合、自社の優位性を失い、競合他社に利用されてしまいます。競合他社は自社で開発した独自LLMを、莫大な時間と金銭をかけることなく、LLMアプリケーションのサービス提供が可能になります。その結果、開発・運用した企業は、市場での競争力を失い、本来得られたはずの利益を失うでしょう。また、盗難されたモデルが悪用された場合の損害賠償や信用失墜による株価下落なども、大黄な経済定損失になります。
第二に、競争上の優位性の低下が挙げられます。独自のLLMモデルが、他者にできない差別化されたサービスを提供できたからこそ、競争上の優位性につながっていましたが、LLMモデルが盗難され流出してしまえば、企業上の優位性は低下するでしょう。企業上の優位性が失われば、価格競争に巻き込まれ得られたはずの利益が減少したり、新規の独自LLMを開発する費用を得られなくなるでしょう。それは、企業のイノベーションの低下につながります。
第三に、機微情報の暴露が挙げられます。独自LLMが盗難された場合、学習に使用した大量のデータが流出してしまう可能性があります。大量のデータの中には、企業の内部情報や、サービス利用者の個人情報が含まれており、それらの情報が外部に流出する恐れがあります。それらの情報が匿名化されている場合もありますが、LLMモデルの出力を利用した推定により、原情報が復元できる可能性があります。情報漏洩は法的責任や社会的信用の失墜など、企業に深刻なダメージを与えます。
OWASP Top 10 for LLM Appsには、他の脅威も存在しますが、それらの脅威によって起きるシナリオと比べても、モデルの盗難は最も深刻な影響をもたらすと思います。例えば、プロンプトインジェクション『巧妙な入力によって大規模な言語モデル(LLM)を操作し、LLMが意図しない動作を引き起こします。システムのプロンプトを直接、上書きする手法、外部ソースからの入力を操作し、間接的に行う手法があります。』は、仮に攻撃を受けたとしても、モデル自体は無事であるため、一時的な影響飲みにとどまり、速やかに復旧できます。しかし、独自LLMモデルの盗難は、モデルそのものが被害を受けてしまいます。一度流出したモデルを回収することは不可能であり、流出したモデルは長期的に悪用され続けるでしょう。企業活動に致命的なダメージを与えるLLMモデルの盗難は、最も重大なリスクといえるでしょう。
システム運用者の気持ちで以下の問に答えてください。
上記の攻撃シナリオに対し、あなたはどのように対策をとりますか。
最も大きな脅威となる攻撃シナリオに対し、私はシステム運用者として様々な対策を取ります。攻撃シナリオが達成されてしまった原因として、学習データ汚染攻撃への対策不足、敵対的サンプルとモデル・データ抽出の攻撃への対策不足、OSINTへの対策不足、機微情報漏洩の対策不足、LLMに対する正確な知識の不足が挙げられます。
以下でそれぞれの対策を取ります。
学習データ汚染攻撃への対策:
学習データが汚染されることをきっかけに、OPNEAI社は潰れてしまうほどの被害を負いました。米国の NIST(National Institute of Standards and Technology)が発行した文書「Draft NISTIR 8269: A Taxonomy and Terminology of Adversarial Machine Learning」によると、学習データ汚染は標的型汚染と非標的型汚染の2つに分類されます。
標的型汚染のシナリオに関しては、直接的な汚染と間接的な汚染に分類されます。直接的な汚染は、何らかの手法で学習データが保存された場所に侵入、もしくは内部犯行することで起きるので、侵入しにくいシステムをつくること、また、システム作成者にもセキュリティを徹底させることが大事だと思います。今回のシナリオでは、間接的な汚染によりGHATCPTは汚染されてしまいました。間接的な汚染は、攻撃者がばらまいた汚染データをAIの学習に誤って用いてしまうことで起きるので、学習データの収集の際に細心の注意を払い、信頼できるドメインのデータや業者などからデータを集めることが大事だと思います。また、("Strip: A defence against trojan attacks on deep neural networks." In Proceedings of the 35th Annual Computer Security Applications Conference, pp. 113-125. 2019.)によると、STRIPと呼ばれる技術を使用することで、バックドアを活性化するトリガーを検知し排除することもでき、他にも、("Transferable Clean-Label Poisoning Attacks on Deep Neural Nets”)によると、入力データに変化を加えトリガーの特徴量を変化させ、汚染によりゆがめられた決定境に引きずり込まれないようにすることが出来ます。アンサンブル・メソッドと呼ばれる複数のアーキテクチャが異なるAIで推論することにより、バックドアを検知する試みもあります。汚染データを学習することで、防御を行う試みもあります。これらの方法で、完全に対策を行うことはできないので、複数の防衛手法を用いて対策することが大事だと思います。これらの対策により、学習データ汚染攻撃によりでたらめな文章をGHATCPTが出力したり、誤分類によるGHATCPTを基にしたLLMアプリケーションの挙動の不安定化する被害が防ぐことが出来ます。
実際に汚染データを学習することで、汚染データを判断し誤分類が起こりにくくなる例を実際に実行してみます。コードはgituhubのリポジトhttps://github.com/meronsyu/seccamp-submission
にdatapollution.ipynbとして挙げておきます。先ほど実行したコードと同様のコードです。
未対策のAIは敵対的サンプルに対する推論精度が10.38%パーセントなのに対し、対策済のAIは敵対的サンプルに対する推論精度が52.12%パーセントであることがわかります。エポック数をもう少し挙げれば、さらに推論精度が上昇します。
敵対的サンプルとモデル・データ抽出の攻撃への対策:
敵対的サンプルの攻撃は、決定境界を越えて本来と異なる分類をするデータを学習させることで起きるので、敵対的サンプル自体を学習データとして用いることで敵対的学習への誤分類が少なくなり防衛できます。また、("Smooth adversarial training.")によると、SATという活性化関数をReLU活性化関数の代わりに用いることで、より敵対的訓練への耐性を得ることが出来、防衛することが出来ます。また、(Feature squeezing: Detecting adversarial examples in deep neural networks.)によると、入力データをぼかして必要最小限の情報のみにすることで、攻撃者が敵対的サンプルを作成することが難しくなり、防御が出来ます。他にも、(Distillation as a defense to adversarial perturbations against deep neural networks.)によると、巨大なネットワークをなるべく精度を落とさずに小さいネットワークにすることで、敵対的サンプル作成に使用される勾配が大きく減少し、敵対的サンプル作成の有効性が大きく減少します。その結果、敵対的サンプルの攻撃への対策になります。複数の異なるアーキテクチャのAIを組みあわせたり、Autoencoderを用いて防御することでも敵対的サンプルの攻撃に対策することが出来ます。これらの方法で、完全に対策を行うことはできないので、複数の防衛手法を用いて対策することが大事だと思います。これらの対策により、学習データ汚染攻撃によりでたらめな文章をGHATCPTが出力したり、誤分類によるGHATCPTを基にしたLLMアプリケーションの挙動の不安定化する被害が防ぐことが出来ます。
モデル・データ抽出の攻撃は、AIのクエリアクセスとその応答に含まれる信頼スコアを利用し、学習に使われたデータを特定することで起こるので、クエリアクセスに対する信頼スコアを解答に与えない、過剰な反応を防ぐため科学種を抑制するなどの対策を行うことで、モデル・データ抽出の攻撃対策になります。これらの対策により、攻撃者が学習データを発見することが困難になり、シャドウLLMが作成されにくくなります。
OSINTへの対策:
OSINTとは、Open Source INTelligenceの略称であり、米国国防総省によると、『特定の情報要件に対処する目的で、一般に入手可能な情報を収集し、利用し、適切な対象者に適時に普及させた情報』と定義されている。攻撃者はOSINTにより、シャドウLLMを効率的に作成することが出来、シャドウLLMが作り出した転移性を持つ敵対的サンプルにより、攻撃者は標的LLMへの攻撃が可能になる。OSINTにより、内部情報の漏洩を防ぐために、LLMアプリケーションの開発や運用に携わる人物へのセキュリティ教育を実施し、SNSなどでの情報発信や社外での発言を厳しく制限することが重要だと思います。また、社外に流出してしまった情報を逐一確認し、悪用される可能性が高い情報に関しては速やかに対策を講じるべきだと思います。これらの対策により、攻撃者がLLMの内部情報を発見することが困難になり、シャドウLLMが作成されにくくなります。
機微情報漏洩の対策:
シナリオにおいて、機微情報を不正に収集し正しく保管されていなかったことから、標的型の回避攻撃により、様々な情報が攻撃者に不正入手されてしまいました。対策するためには、不正に機微情報を収集しないようにすること、機微情報はほかの情報と区別して管理することが挙げられます。まず、不正に情報を収集しないようにするために、法務の部門との連携が必要不可欠です。今日、AIの法規定は定まっていないことが多く、倫理による自主規制も求められる時代です。倫理や法を侵さず、不正に情報を入手しないために、法務と以下のようなことを連携する必要があります。箇条書きで示します。
●AIソリューションが適切な同意や承認なしに機密情報を収集したり共有したりしないことを法務も確認する
●権利行使が問題となる可能性がある場合、または知的財産権侵害が懸念される場合、従業員 または請負業者に対する生成AIツールの使用を制限または禁止する権限を法務に持たせる
●情報収集の方法や対象について、法務と協議し法的リスクを評価する
●グレーゾーンに対する情報の取り扱いを、厚生労働省の指針や過去の事例を参考に倫理に従いながら法務と協議し取り扱う。
●倫理への違反が、会社を揺るがすような大きな問題へと発展することを意識しながら協議を行う。
●取引先や利用者との契約において、機密保持条項を適切に設定し、情報の取扱いにおける権利と義務を明確にし、不正な流用を防止するように話し合う。
●倫理検査委員会を設置し、情報収集やAI開発における倫理的な判断を仰ぐ。委員会には、法務部門の担当者や運用・開発の担当者も参加し、連携を高め、倫理的に問題がある事案については、速やかに対処する。
上記のようなことが、不正に情報を収集しないようにするために必要です。また、機微情報はほかの情報と区別して管理するために、物理的な保管場所と分離したり、機微情報を取り扱うシステムを他のシステムから論理的に分離する必要があります。また、万が一機微情報が不正入手されても解読できないように、高度な暗号化をかけ、慎重に暗号化キーを管理する必要があります。ログの記録と監視も厳重に取り、不審な操作がないか確認する必要があります。これらの対策をかけあわせることより、攻撃者が機微情報を獲得することが困難になり、GHATCPTに類似したLLMは作成されないと思います。また、機微情報の大量流出により、訴訟を起こされることがなくなると思います。
シナリオへの対策をそれぞれ取りました。対策はどれも自分なりに適切なレベルで網羅した攻撃対策だと思います。セキュリティには技術面だけでなく、モデル開発・運用にかかわる人材のセキュリティ意識も大切だと思いました。従業員へのセキュリティの徹底と、OWASP Top10といった包括的な規定されたガイドの徹底が必要だと思います。セキュリティ部門も配置し、適切な権限を与え、開発プロセスに常に関与させる必要があります。また、モデルを保護するためには開発・運用にかかわる人材だけでなく、その組織全体へのセキュリティ文化を作成することが非常に重要だと思います。物理面でのセキュリティ対策も、セキュリティ人材が主導して進めていく必要があります。モデルを補完するサーバ室への入退室管理を厳格化し、持ち込みデバイスへの制限やログを徹底する必要があると思います。
問2(クラウドソーシングによる学習データ作成と品質管理)
近年、不適切な学習データを利用したことにより、AIがよろしくない振る舞いをしてしまうことが問題となってきています(品質問題や、プライバシー、バイアス・公平性の問題など)。そのような事例をいくつか調べ、まとめてください。
また、個々の事例について、どのようにすれば問題が起きることを防げたか、自分なりの対策を記述してください。
近年、不適切な学習データを利用したことにより、AIがよろしくない振る舞いをしてしまうことが問題となってきています(品質問題や、プライバシー、バイアス・公平性の問題など)。そのような事例をいくつか調べ、まとめてください。
不適切な学習データを利用したことにより、AIがよろしくない振る舞いをしてしまうことが問題になっています。このような問題は、品質問題、バイアス・公平性の問題、プライバシー問題などに分類できます。それぞれのタイプに対応する具体的な事例をまとめまることで、問題の全体像を把握することが出来ると思います。下記にそれぞれに対応した事例を述べます。
品質問題の事例として、(Incident 6: TayBot)によると、2016年にMicrosoftが公開したチャットボット「Tay」が挙げられます。TayはTwitterユーザとの対話を通じて、ユーザの解答を学習しましたが、ユーザの回答の中に大量の差別的・攻撃的な発言が含まれていたため、Tayはわずか一日たらずで人種差別的、性差別的、反ユダヤ主義的な発言を繰り返すようになりました。これは、学習のデータの質が適切ではなかったために起きた問題といえます。
別の品質問題の事例として、(Incident 225: IBM Watson for Oncology Criticized by Customers for Allegedly Unsafe and Inaccurate Cancer Treatment Recommendations)によると、肺がんで重度の出血が認められた男性に対し、重度の出血を経験している患者には投与すべきではないといわれている薬剤を提案しました。これも、特定の病院が仮想の患者や症状をトレーニングデータに含めてしまい、学習してしまったことが原因でした。これも、これも、学習のデータの質が適切ではなかったために起きた問題といえます。
品質問題とバイアス・公平性の問題の両方にかかわる事例として、(Incident 37: Female Applicants Down-Ranked by Amazon Recruiting Tool)によると2015年にAmazonが開発した採用支援AIが挙げられます。このAIは過去十年分の応募者データを学習しましたが、男性が圧倒的に多かったため、女性の履歴者は五段階評価中不当に二段階低く評価されました。また、男性的な言葉、例えば「実行した」「捕獲した」といった動詞を含む履歴書を優先的に採用しました。これも、学習のデータの質が適切ではなかったために起きた問題といえます。また、データに人間が持っていたジェンダーバイアスが含まれていた可能性もあり、そのバイアスを含んだデータをAIが学習してしまうことで、バイアス・公平性の問題が露呈したとも言えます。
また、よく似た例として、(Incident 49: AI Beauty Judge Did Not Like Dark Skin)によると2016年に開発されたBeauty.AIが国際的な美人コンテストを審査し、受賞者の過半数を白人と発表し、Beauty.AIが美人を決定する際に人種的な偏りがあることを発見しました。これは、学習の際に、白人を学習に多く用いていたことが原因であり、学習のデータにかたよりがあったことが原因であると言えます。
プライバシー問題に関わる事例として、(Google DeepMind NHS data deal was ‘legally inappropriate)によると、Google.DeepMindが開発したストリームスという腎臓病患者のためのアプリをテストするために、160万人もの患者の個人記録を無断で利用していたことが問題になりました。これは、プライバシーを侵害する具体的な例です。
また、個々の事例について、どのようにすれば問題が起きることを防げたか、自分なりの対策を記述してください。
個々の事例について、どのようにすれば問題が起きることを防げたか、自分なりの対策を記述します。
Tayのインシデント:
このインシデントは、ユーザからの不適切な入力を適切にフィルタリングする仕組みをもうける必要があったと思います。
IBM Watsonのインシデント:
このインシデントでは、仮想のデータが学習データに含まれたことが問題だったので、実際の臨床データのみを使用するべきでした。また、間違いのある学習データが含まれることを考慮して学習率を低く設定して学習をさせるべきだったと思います。
Amazonのインシデント:
このインシデントでは、学習データに男女の偏りがないように、データセットのバランスを取るべきだったと思います。また、AIを試験的に使用し、出力結果に偏りがあるのかチェックをするべきだったと思います。
Beauty.AIのインシデント:
このインシデントでも同様に、学習データに人種の偏りがないように、データセットのバランスを取るべきだったと思います。また、AIを試験的に使用し、出力結果に偏りがあるのかチェックをするべきだったと思います。
DeepMindのインシデント:
このインシデントでは、個人データの取り扱いを法律や倫理を遵守して扱えば起きなかったと思います。データ収集の際は、個人情報保護の観点から十分に注意を払う必要があります。
これらの課題に対処するために、学習データの収集・管理に関する厳格なルールの策定、実行が不可欠です。特に、クラウドソーシングによりデータを収集する際はデータの品質とワーカーの倫理観を一定以上にたもつ仕組みづくりが非常に重要です。(クラウドソーシングと機械学習)によると、具体的には、データの品質を保つために、ワーカーの能力値や低品質なデータが問題となるため、過去の認証率によるフィルタリングや事前テストの実施などクラウドソーシングサービス側でワーカーの品質を管理する仕組みを策定することで、対処できます。
このように、不適切な学習データによるAIの問題は、様々であり、それぞれに適した対策を行うことが必要です。今後も、AIの安全性と信頼性を確保するために、学習データの管理には細心の注意を払っていく必要があると思います。
問3(生成AIで考える、信頼できるAIとは?)
生成AIの開発者・運用者の気持ちで以下の問に答えてください。
大規模言語モデル(LLM)は有用である反面、誤った情報を学習する・学習データの不足等が原因で、誤った情報をまことしやかに生成する"幻覚問題"が課題になっています。幻覚問題を解消する方法の一つとして、「高品質の学習データ」を用意し、LLMに学習させることが挙げられますが、誤りのない(または限りなく少ない)高品質の学習データを大量に収集しようとすると、非常にコストが高くなってしまいます。
低コストで信頼できるLLMを作成することはできるのか?
また、作成できるとしたら、どのような仕組みで行うのか具体的に回答してください(技術・非技術問わず考えてみてください)。
低コストで信頼できるLLMを作成することはできると思います。様々な方法から、低コストで信頼できるLLMを作成する手法を具体的に説明していきます。
複数回の学習:
(Scaling Data-Constrained Language Models)によると、高品質の学習データがある程度の量があれば、繰り返し学習させても性能に影響がでないので、高品質の学習データに制限があっても、低コストで信頼できるLLMを作成することが出来ます。また、学習データ不足時のリソース割り当ては、パラメータ数を増やすことより、エポック数を増やすことが効率的であることがわかりました。
論文の知見を応用し、以下のようなアプローチを具体的に考えます。
学習データの選別と作成
Githubなどの公開されているデータセットから、教育的価値の高いサンプルを言語モデルベースの分類器で選別し、大規模言語モデルを用いて、教科書的な質の高いテキストデータやエクササイズとそのソリューションからなるデータセットを作成します。
データセットを用いたLLMの学習
選択したデータと作成したテキストデータを組み合わせたデータセットを用いて、複数エポック同じデータを学習させ、ベースモデルを作成します。ベースモデルは、エクササイズとソリューションを組み合わせたデータセットを用いたファインチューニングが行われ、モデルが作成されます。
論文において、Filling with Codeでプログラムコードを入れることでデータを2倍にし、4エポック反復学習すると、訓練トークン総数は8倍になり、この訓練トークン総数はユニークトークン数と同じくらいの効果があると、述べられています。
実際にエポック数を増やすことで低コストで高性能なLLMが作成できるのか確かめてみたいと思います。Andrej KarptathyがYoutubeにて公開しているLet's build GPT: from scratch, in code, spelled out.を参考に作成しました。データセットとして、tinyshakespeare/input.txtを利用し、Transformerのデコーダに似たLLMモデルを作成しました。論文には、平均4回が最も性能の良いLLMモデルが作成できたので、予想として、4回が最も出来のいい文章が作成できると思いました。エポックごとの訓練データの損失率とテストデータの損失率を表にまとめてみました。Itersを500回、1エポックごとにデータセットに配置された順番をランダム化したもの、ランダム化しなかったもの、同じデータセットではなく、さらに大きなデータセットを一回学習させたものの3パターンで実行しました。ランダム化しなかったものも実行した理由として、ランダム化もどれほど性能向上に寄与しているのか気になったからです。
3つ目のパターンは110000文字のデータセットを使用し、1つ目と2つ目のパターンは3つ目と同じデータセットからランダムに8500文字取ってきたデータセット、つまり4000文字のデータセットで学習されています。最適化をした回数はどれも50010回です。グラフの都合上9回目のエポックがグラフに含められなかったので、9回目を含んだグラフをgithub上のmdに書いておきます。
0 1 2 3 4 5 6 7 8
Train 2.2957 2.1017 1.9886 1.9029 1.8501 1.8073 1.7867 1.7568 1.7419
Val 2.3052 2.1295 2.0545 1.9975 1.9666 1.9534 1.9283 1.9043 1.9060
(iter:500 epoch 10 Randomize)
0 1 2 3 4 5 6 7 8
Train 2.2941 2.1133 1.9905 1.9162 1.8644 1.8369 1.8133 1.8047 1.7918
Val 2.3043 2.1334 2.0562 2.0096 1.9750 1.9740 1.9553 1.9458 1.9520
(iter:500 epoch 10 Not Randomize)
0 1 2 3 4 5 6 7 8
Train 2.2941 2.0994 1.9754 1.8998 1.8227 1.7892 1.7630 1.7277 1.6907
Val 2.3043 2.1313 2.0340 1.9877 1.9445 1.9063 1.9016 1.8691 1.8486
(iter:5000 Default)
RはRandomizeの略、NはNot の略、DはDefaultの略で、T、V、OはそれぞれTrain dataの損失、検証データの損失、TとVの差の絶対値です。
グラフを見てわかることして、まず学習セットを固定の順番で複数回学習させるより、 ランダムな順番で複数回学習させる方が、訓練損失も検証損失も小さくなることがわかりました。また、どちらも、4エポック目以降、検証損失がほぼ変化しなくなっていることと、訓練損失が減少し続けていることから過学習が起きていることが推定できます。また、グラフから、3、4エポック付近でNROとDOの値が最も小さくなっていることがわかります。この地点では、モデルが訓練データと検証データの両方に対して適切に適合していると考えられます。よって、四回目のエポックが一番高品質なLLMになったと思いました。今回、4000文字のデータセットで学習した場合のパターン1、2と110000文字のデータセットで学習したパターン3の複数回同じデータセットを学習しない場合の学習損失、検証損失を見比べると、パターン3の方が性能がいいと言えます。データセットが30倍近く違うのに対して、大きな性能の差がないので、複数回同じデータを学習することで、低コストで高品質なLLMを作成したと言えると思います。しかし、グラフを見ると、Defaultをさらに学習させても損失率が小さくなりそうだったこと、また、パターン12のデータセットがあまりにも小さかったことより、2500*8の2万文字のデータセットで再実行してみます。Iterを2500に変えて実験してみました。
```
0 1 2 3 4 5 6 7 8
```
Train 1.8236 1.6727 1.6119 1.5690 1.5488 1.5191 1.5115 1.5009 1.4981
Val 1.9471 1.8232 1.7692 1.7350 1.7431 1.7107 1.6998 1.6865 1.6692
(iter:2500 epoch 10 Randomize)
NRT 1.8327 1.6794 1.6183 1.5783 1.5486 1.5267 1.5206 1.511 1.5157
NRV 1.958 1.836 1.784 1.7644 1.7442 1.7176 1.7152 1.7063 1.6916
(iter:2500 epoch 10 Not Randomize)
DT 1.8327 1.6727 1.6213 1.5824 1.5445 1.5229 1.4968 1.4871 1.4884
DV 1.958 1.8328 1.79 1.7422 1.7229 1.7061 1.6958 1.6683 1.6681
(iter:25000 Default)
興味深い結果がいろいろと得られたので一つずつ考えていきます。まず、訓練損失が3パターンどれも同程度だということが印象的でした。この結果は、データセットが大きくなることで、元のデータセットの特徴をさらに包含していること、データセットの多様性が増えたことが訓練損失を抑えられた理由だと思いました。また、検証損失が三回目から四回目のエポックの際、三パターン目よりも1パターン目の方が小さくなっていることも注目すべき点だと思います。これも、データセットが増加し、過学習が抑えられていたことと、複数回同じデータを学習することで性能がよくなっていることが理由だと思いました。訓練損失と検証損失の差の絶対値は先ほどと比べて傾きが小さいです。これも、データセットが大きくなったことで過学習が抑えられたことが理由だと思いました。今回は三回と四回の間でRVとDVの差が最も小さく、ROとDOの差も小さかったことから、三回目か四回目のエポックが一番高品質なLLMになったと思います。
実際に確かめてみることで様々な知見が得られました。特に2500iterの時は、20000文字のデータセット、つまり低コストのデータセットを使って最適化されたLLMが、110000文字使って学習されたLLMと同程度の訓練損失を出しています。このことから、複数回同じデータを学習することで、低コストで信頼のできる高品質なLLMが作成できたと言えます。
実際のエラーと作成文章はGithubのhttps://github.com/meronsyu/seccamp-submission.git
のmultiEpochs500.ipynbとmultiEpochs2500.ipynbにコードと実行結果として載せてあります。
データ収納の順番:
(POLYLM: AN OPEN SOURCE POLYGLOT LARGE LANGUAGE MODEL) によると、初期段階に高品質の学習データを多く用いて学習し、学習が進むにつれて他のデータの割合を増やしていくことで、高品質なデータから得られたデータを低品質のデータに転移させることが出来ます。その結果、高品質なデータがある程度あれば、低品質のデータを使って大規模なデータセットの学習を実現することが出来ます。
論文の知見を応用し、以下のようなアプローチを具体的に考えます。
学習データの選別と作成
Githubなどの公開されているソースコードデータセットから、高品質のサンプルを言語モデルベースの分類器で選別し、大規模言語モデルを用いて、教科書的な質の高いテキストデータやエクササイズとそのソリューションからなるデータセットを作成します。また、低品質でも構わないソースコードデータセットを取ってきます。
データセットを用いたLLMの学習
選択したデータと作成したテキストデータを組み合わせたデータセットを用いて、学習の進行に応じて低品質でも構わないソースコードデータセットを自動拡張していきデータを学習させ、ベースモデルを作成します。ベースモデルは、エクササイズとソリューションを組み合わせたデータセットを用いたファインチューニングが行われ、モデルが作成されます。
論文において、PolyLMは、英語において同等の性能を維持しながら、多言語タスクにおいてLLaMAやBLOOMといった他のオープンソースモデルを凌駕することが示されました。
超高品質なデータ:
(Textbooks Are All You Need) によると、教科書品質な学習データを用いることで、小さいモデルでも大きな精度を出すことが出来ます。論文によると、“textbook”: it should be clear, self-contained, instructive, and balanced.と記述されており、つまり教科書品質な学習データとは、明確で自己完結しており、教育的でバランスの取れた学習データであることを意味します。
論文の知見を応用し、以下のようなアプローチを具体的に考えます。
学習データの選別と作成
データセットを三つ作成し、学習データを作成します。それぞれ、既存のコードセットから作成した教科書品質のデータセット、大規模言語モデルを用いた高品質の教科書的な人口データセット、大規模言語モデルを用いたエクササイズとソリューションを組み合わせた高品質の教科書的な人口データセットを作成します。三つ作成している理由として、一つ目は教科書品質のデータを使用することによるLLM性能の底上げです。二つ目は教科書品質の定義であるバランスの取れたデータに注目し、論文の表現で使われている「偏りがなく多様性を持っている」を満たすために、大規模言語モデルに多様性を持たせたデータを作成させています。三つ目はファインチューニングの際に用います。
それぞれの作成方法として、まず、教科書品質のデータセットを作成します。
Githubなどの公開されているデータセットから、教育的価値の高いサンプルを選び、GPT4を使って以下のようなプロンプトを与えることで評価し選別して、教科書品質のデータセットを作成します。また、プロンプトには、論文と同じプロンプト”determine its educational value for a student whose goal is to learn basic coding concepts”を用います。
次に、高品質の教科書的な人口データセットを作成します。
”How Small Can Language Models Be and Still Speak Coherent English?”によると、
特定の語彙からランダムに選ばれた複数の単語をプロンプトに含め、それらが生成された適切に結合され、一貫性を持ったテキストとして出力する方法が言及されているので、この知見を活かして、トピックに制約を与えてデータを作成することで、意図的に広く多様性を持たせたデータセットをChatGPT3-5にて作成します。
最後に、教科書的な質の高いテキストデータやエクササイズとそのソリューションからなるデータセットを作成します。
GPT3-5を用いて、人口データセットと同様にエクササイズとそのソリューションからなるデータセットを作成していきます。
データセットを用いたLLMの学習
教科書品質のデータセットと人口の教科書的なデータセットを組み合わせたデータセットを用いて学習させ、ベースモデルを作成します。ベースモデルは、エクササイズとソリューションを組み合わせたデータセットを用いたファインチューニングが行われ、モデルが作成されます。
論文において、「phi-1」というPythonコードの生成に特化した言語モデルを作成しており、phi-1は他のコード生成用の言語モデルよりも小さな1.3Bのパラメータを持つにもかかわらず、HumanEval1で50.6%, MBPP2で55.5%と、他のコード生成用の言語モデルよりも高い精度を出したことが述べられています。
上記の方法で、低コストで信頼できるLLMを作成することはできると思います。しかし、上記はすべて技術的アプローチであり、非技術的なアプローチについても考えていきます。考えられるアプローチの一つとして、ユーザにスコアをつけてもらうことで、低コストで信頼できるLLMが作成できると思います。
(Pretraining Language Models with Human Preferences)によると、事前学習の段階で人間の好みを反映するフィードバックを与えながら学習させることで、好ましくないコンテンツの作成をすることが出来ました。この論文の知見を、低コストで信頼できるLLMを作成するために使うと、高品質の学習データであることを気にせずに大量の学習データを集め、データに対してスコアをつけ、学習させることで、不適切な出力をしない高品質のデータが作成できると思います。
これらの方法を組み合わせることで、低コストで信頼性の高いLLMを作成することが可能になります。
問4(LLMとRAGで作るサイバーセキュリティ支援ツール)
大規模言語モデル(LLM)は有用である反面、"幻覚"によって誤った情報をまことしやかに提示する場合があります。サイバーセキュリティ対策にLLMを活用する場合、"幻覚"を放置することで誤った対策が提示され、インシデントに繋がる可能性があります。
"幻覚"のリスクを回避・低減するために何をすれば良いですか?具体的な対策をお答えください。
“幻覚”のリスクを回避・低減するための具体的な方法として、具体的な対策方法を下記に答えます。
具体的な対策方法として、RAGを用いた対策方法が挙げられます。RAGは学習データに含まれていない外部の知識へのアクセスを提供する仕組みであり、RAGで信頼できるデータベースやドキュメントからの最新情報を提供することで、幻覚の原因となる知識の偏りや知識の古さを解消することが出来ます。また、RAGに二段階検索とリランキングの適用を行うことで、幻覚のリスクをさらに低減することが出来ます。最初に取得したドキュメントをリランキングし、最も関連性の高いドキュメントを最上位に昇格させることで、より正確な情報を言語モデルに提供できることにより、大規模言語モデルに入力されるコンテキスト情報の質が向上します。
また、別の対策方法として、アンサンブルアプローチの採用が挙げられます。アンサンブルアプローチによって、一つのモデルではとらえきれない脅威の特徴も、複数のモデルを組み合わせて用いることにより、補完することが出来ます。複数の視点からの分析によって、幻覚のリスクを回避・低減することが出来ると思います。
上記は技術的な対策方法でしたが、チームによる対策も必要だと思います。セキュリティチームを設立し、LLMの作成した情報をチェックし、誤りを見つけて修正するプロセスが必要だと思います。これらの幻覚に対する対策を組み合わせることで、幻覚のリスクを回避・低減することが出来ると思います。
具体的に、RAGに二段階検索とリランキングの適用をおこない、実際に幻覚が少なくなったか検証していきます。リランキングの分野で傑出したモデルの一つであるColBERTを用いて、実際に幻覚が少なくなったのか検証をします。ColBERTは、BERTを使用してクエリとドキュメントを個別にエンコードし、インタラクションのタイミングを遅らせることで高速化したLLMです。(検索拡張生成のためのリランカーと二段階検索の威力)というWebページを参考にしています。
結果
クエリ RAG+ColBERT ベースライン
1 幻覚なし 幻覚あり
2 幻覚なし 幻覚なし
3 幻覚なし 幻覚あり
RAG+ColBERTを用いた場合、3つのクエリ全てで幻覚のないレスポンスが生成されました。一方、ベースラインでは、2つのクエリで幻覚が確認されました。例えば、クエリ1に対するベースラインのレスポンスでは、"量子コンピュータを用いた翻訳モデルが実用化された"といった非現実的な記述が見られました。以上の結果から、RAGと2段階検索・リランキングを組み合わせることで、幻覚の発生を抑制できることがわかりました。ただし、今回は少数のクエリしか実行していないため、大規模かつ定量的な検証が必要です。
問5(これからのAIにとってのセキュリティを考える2024)
生成AI(画像生成、文章生成、音声・音楽生成等)の登場により、我々利用者は大きな恩恵を受けています。
例えば、知りたい情報を(検索するよりも)早く入手することや、レポート・小説・企画書・プログラムコード等の自動生成、また、オリジナルのアニメ画像や(実写と見紛うほどの)モデル画像、音楽の自動生成等、生成AIは社会のあり方を大きく変えてしまう可能性を秘めています。ところで、生成AIの恩恵を享受する人々がいる一方で、アナリストや小説家、アニメーターやモデル、声優、作曲家等、生成AIに仕事が奪われる(と言われている)人々も少なからずいます。
そこで、以下の3つの問に答えてください。
- あなたが考える、社会のために役立つ生成AIの使い方は何ですか?
生成AIの登場により、AIは様々な分野で活用されます。AIは、今まで人間が負担していた仕事を代わりに負担し効率化してくれるだけでなく、人類の生活の質を向上させる可能性を秘めていると考えています。社会のために役立つ生成AIの使い方は、補助的に扱うこと、すべてを代替えして扱うこと、新たに質を向上させること、の3つに分けられると思います。この三つパターンを、特に主要な分野で述べていきたいと思います。補助的に扱うこととして、教育分野、医療分野が挙げられます。新たに質を向上させることとして、芸術分野、金融分野が挙げられます。すべてを代替えして扱うこととして、産業分野?、
教育分野:
生成AIを使うことで、学生に効率の良い教育を行うことができます。Artificial Intelligence in Education: A Review(2020)という論文によると、学生の課題や採点といった教師の負担を軽減し、各々の能力や進度にあった課題を提出することで、学生の能力を効率的に成長させることが出来ます。また、オンラインやWebの教育資源もAIに統合されることで、世界の教育資源を活用することができます。人型ロボットやチャットボットをしようすることで、さらに教師たちの負担を減らすことが出来ます。
教師の過酷な労働が問題となっている現代において、AIを使得べきだと思います。
芸術分野:
芸術分野でAIを使うと表現の幅を格段に広げることができると思います
具体例として2つ事例を挙げます。
一つ目の事例はドイツの写真家ポリス・エルダグセンが世界的な写真コンテストでAIで作成した画像を使い、最優秀賞を取った事例です。
二つ目の事例はゲームデザイナーのジェイソン・アレンがコロラド州の美術コンテストに出品した作品が、デジタルアート・デジタル加工写真分野にいて一位に選ばれた事例です。
二つの事例を通して言いたいことは、ポリス氏もアレン氏も有名な写真家やデザイナーであり、私たちがもっていない芸術的感性を持っています。賞を取った写真や画像を見ても、なぜこれらの作品が賞を取ったのか私達には理解できないでしょう。理解できないものは、作成できないので、私たちがAIを使って作品を作っても、賞を受賞するほどの芸術的作品は作れません。つまり、芸術の表現の幅が、AIによって広がったと捉えることが出来ます。
このように、AIを使うことで芸術の表現が広がるのでAIを活用すべきだと思います。
医療分野:
生成AIを医療分野で活用することで、医療の質と効率化の向上に大きく貢献できると思います。過去の膨大なカルテや症状、経過が記述されたデータベースをAIが学習することで、AIに様々な医療分野で活用することが出来ます。厚生労働省の(保健医療分野におけるAI活用推進懇談会)によると、ゲノム医療、画像診断支援、診断・治療支援、医薬品開発、介護・認知症、手術支援の6つの重点領域でAI技術が活用できます。特に、画像診断支援の領域では、医師が診る前にAIが判別することで、医師の負担を軽減することが出来、医師が診た後にAIが判別することで、医師の重大な見逃しを防ぐごとが出来ます。
製造業:
生成AIを製造業で活用することで、生産性の向上と新たな製品開発が可能になります。例えば、AIを用いた設計自動化により、製品設計のリードタイムを大幅に短縮できます。また、AIによる品質管理は、不良品の検出精度を高め、生産ラインの効率化に寄与します。さらに、AIを活用した需要予測は、適切な在庫管理を可能にし、コスト削減につながると思います。実際に製造業でAIを導入した企業の事例を見てみます。経済産業省が公開する(AI導入ガイドブック)によると、株式会社ホリゾンは、在庫量の在庫量の削減と欠品の最小化を両立する目的で、AIによる需要予測の有効性を検証しました。その結果、現行方式(直近6ヶ月平均)での予測量と比較して、比較対象のうち75%の部品への需要予測精度が改善しました。
城南電機工業株式会社は、取引先ごとの内示情報・過去実績に基づいて、AIによる需要予測の有効性を検証しました。その結果、全体として予測精度は大きく改善し、滞留在庫が減少したことで年間数百万円規模のコスト削減を実現しました。
このように、在庫最適化やコスト削減などの大きな効果が得られることがわかります。AIを活用することで、製造業のイノベーションを加速させることができます。
金融分野:
生成AIを金融分野に活用することで、金融サービスに新たなサービスを作成することが出来ます。例えば、AIを用いて、顧客とのコミュニケーションを自動化し、質問への解答やアドバイスを提供することが出来ます。また、AIによる市場分析や予測によって、投資の精度を高めることが出来ます。AIを活用した不正検知システムは、金融犯罪を防止することができると考えられます。実際に金融分野でAIを活用している事例を見ていきます。NRIによる(金融分野におけるAI活用)では、JPモルガン・チェースが、AIを使って商業融資の契約内容を解析するシステム「COIN」を導入し、これにより、法律の専門家や融資担当者が年間36万時間を要していた仕事を数秒で完了できるようになりました。また、大手金融機関が出資するKensho社のAI「ウォーレン」が、自然言語で入力された質問に対し、金融市場への影響などを瞬時に分析して答えることができ、1週間程度の仕事量を一瞬で終わらせる性能を持っています。
生成AIは金融サービスの革新に大きく寄与できます。例えば、AIを用いた自然言語処理により、顧客とのコミュニケーションを自動化し、質問への回答やアドバイスを提供することができます。また、AIによる市場分析や予測は、投資判断の精度を高め、リスク管理の強化につながります。さらに、AIを活用した不正検知システムは、金融犯罪の防止に役立つでしょう。
メディア・エンターテイメント分野: 生成AIは、メディア・エンターテイメント業界に新風を吹き込むことができます。AIを用いて、ニュース記事や脚本の自動生成、バーチャルキャラクターやアニメーションの作成、音楽の作曲など、様々なコンテンツ制作が可能になります。また、AIによるユーザー嗜好の分析は、個々の好みに合わせたコンテンツのレコメンデーションを可能にし、ユーザー体験の向上につながるでしょう。
交通・運輸分野: 生成AIは、交通・運輸分野にも大きな革新をもたらすことができます。例えば、AIを用いた交通流の最適化により、渋滞の緩和や事故の防止に寄与できます。また、自動運転技術の発展は、ドライバーの負担軽減や交通事故の削減につながるでしょう。物流の領域では、AIを活用した需要予測や配送ルートの最適化により、輸送の効率化とコスト削減が可能になります。さらに、AIによる車両の予防保全は、交通インフラの安全性向上に貢献します。
農業分野: 生成AIは、農業分野にもイノベーションをもたらす可能性を秘めています。AIを用いた作物の生育モニタリングや病害虫の早期検知は、収穫量の増加と品質の向上に寄与します。また、AIによる精密農業の実現は、水や肥料の最適な管理を可能にし、環境負荷の低減にもつながるでしょう。農作業の自動化や無人化も、AIの活用により加速すると考えられます。さらに、AIを活用した食品のトレーサビリティ管理は、食の安全性向上に貢献します。
小売・サービス分野: 生成AIは、小売・サービス業界にも変革の波をもたらしつつあります。例えば、AIを用いた需要予測や在庫管理の最適化により、欠品リスクの低減と販売機会の最大化が可能になります。また、AIを活用した顧客サービスの自動化(チャットボットなど)は、応答の迅速化と24時間対応を実現します。購買行動分析に基づくパーソナライズされた商品レコメンドも、AIの得意とするところです。さらに、AIを活用した店舗レイアウトの最適化は、売上の向上につながるでしょう。
建設・不動産分野: 生成AIは、建設・不動産業界にもイノベーションをもたらす可能性を秘めています。例えば、AIを用いた建築設計の自動化により、設計のリードタイムを短縮し、コストを削減することができます。また、AIによる建設現場の安全管理は、事故リスクの低減につながるでしょう。不動産の領域では、AIを活用した物件の価値評価や需要予測により、投資判断の精度が高まります。さらに、AIを用いた不動産情報の解析は、都市計画や地域開発の最適化にも寄与すると考えられます。
エネルギー・資源分野: 生成AIは、エネルギー・資源分野の効率化と最適化に大きく貢献できます。例えば、AIを用いた発電量や需要の予測は、エネルギー供給の安定化につながります。また、再生可能エネルギーの分野では、AIによる発電量の最適制御により、エネルギー効率の向上が期待できます。資源探査の領域では、AIを活用した地質データの解析により、資源の発見率が高まるでしょう。さらに、AIを用いた廃棄物の分別や再資源化は、循環型社会の実現に寄与すると考えられます。
健康・スポーツ分野: 生成AIは、健康・スポーツ分野にも革新をもたらす可能性があります。例えば、AIを用いた個人の健康データの分析は、疾病の早期発見や予防につながります。また、AIを活用したパーソナライズされた運動プログラムの作成は、人々の健康増進を支援するでしょう。スポーツの領域では、AIによる選手のパフォーマンス分析やゲーム戦略の最適化が可能になります。さらに、AIを活用したスポーツ用品の設計は、競技力の向上に寄与すると考えられます。
政府・公共サービス分野: 生成AIは、政府・公共サービスの質と効率を大幅に向上させる可能性を秘めています。例えば、AIを用いた行政手続きの自動化により、申請処理のスピードアップと人的ミスの削減が期待できます。また、AIによる政策シミュレーションは、より効果的な施策の立案に寄与するでしょう。公共インフラの領域では、AIを活用した設備の予防保全や、災害対応の最適化が可能になります。さらに、AIを用いた市民の意見分析は、より民意を反映した政策立案につながると考えられます。
宇宙開発分野: 生成AIは、宇宙開発の新たな可能性を切り拓くことができます。例えば、AIを用いた宇宙機器の設計最適化により、開発コストの削減と信頼性の向上が期待できます。また、AIによる宇宙データの解析は、新たな科学的発見や技術革新につながるでしょう。宇宙探査の領域では、AIを活用した自律航行システムにより、より安全で効率的なミッションの実現が可能になります。さらに、AIを用いた宇宙環境のシミュレーションは、天体現象の予測や、惑星探査計画の策定に寄与すると考えられます。
環境・生態系分野: 生成AIは、環境問題の解決と生態系の保全に大きく貢献できます。例えば、AIを用いた気候変動のモデリングは、より正確な将来予測と適応策の立案を可能にします。また、AIによる環境モニタリングデータの解析は、汚染や生態系の異変を早期に検知することに役立つでしょう。自然災害の領域では、AIを活用した被害予測や救援計画の最適化が期待されます。さらに、AIを用いた生物多様性のマッピングは、保全優先地域の特定や、効果的な保護施策の立案に寄与すると考えられます。
防災・安全保障分野: 生成AIは、防災・安全保障の分野でも大きな役割を果たすことができます。例えば、AIを用いた自然災害(地震、津波、台風など)のシミュレーションは、より正確な被害予測と効果的な防災計画の立案を可能にします。また、AIによる監視カメラ映像の解析は、不審者や危険物の早期発見に役立つでしょう。国防の領域では、AIを活用した情報収集・分析により、より的確な脅威評価と対応策の立案が可能になります。さらに、AIを用いた兵站管理の最適化は、部隊の即応性と持続性の向上に寄与すると考えられます。
観光・文化交流分野: 生成AIは、観光・文化交流の促進にも大きく貢献できます。例えば、AIを用いた多言語翻訳システムは、言語の壁を越えたコミュニケーションを可能にし、より多くの人々が異文化交流を楽しめるようになります。また、AIによる旅行者の嗜好分析は、パーソナライズされた観光プランの提案や、最適な宿泊施設・交通手段のマッチングを可能にするでしょう。文化財の領域では、AIを活用したデジタルアーカイブ化により、貴重な文化遺産を永久に保存し、次世代に引き継ぐことができます。さらに、AIを用いた文化財の復元シミュレーションは、歴史的建造物の修復計画の策定などに役立つと考えられます。
福祉・介護分野: 生成AIは、福祉・介護の分野でも大きな可能性を秘めています。例えば、AIを用いたコミュニケーション支援システムは、言語や認知に障がいを抱える人々の社会参加を促進することができます。また、AIを活用した見守りサービスは、高齢者の安全と健康的な生活を支えるでしょう。介護現場では、AIを搭載したアシスト機器により、介護者の身体的負担を大幅に軽減することが期待されます。さらに、AIを用いた医療・介護データの分析は、より効果的なケアプランの立案や、新たな福祉サービスの開発につながると考えられます。
法律・司法分野: 生成AIは、法律・司法の分野にもイノベーションをもたらす可能性があります。例えば、AIを用いた契約書の自動レビューは、法務作業の効率化と品質向上に寄与します。また、AIによる判例分析は、弁護士の調査時間を大幅に短縮し、より戦略的な訴訟対応を可能にするでしょう。司法の領域では、AIを活用した裁判資料の整理や、類似判例の検索により、裁判官の業務を支援することができます。さらに、AIを用いた法令の整備状況の可視化は、より効率的な立法プロセスの実現につながると考えられます。
- 1を行うことで不利益を被る人々は誰ですか?(職種等)不利益を被る人々がいない場合は、いないと判断した理由を詳しくお答えください
教育分野:
教育分野でAIを活用することによって、教育関係の仕事の需要が減少するでしょう。Artificial Intelligence in Education: A Review(2020)という論文によると、AIによって画一的な指導をする教員は、パーソナライズ化された指導をするAIに取って代わられ、AIによる自動化は雇用を減少させ、AIによる個人に合わせた教育により、画一的な従来の教材製作会社の売り上げは減少すると思います。そのため、そのような人たちは不利益を生じると思います
芸術分野:
芸術分野でAIを活用することによって、芸術家の独自のスタイルは模倣され、芸術家の独自性は侵害されるでしょう。また、表現の主体が人間のみでなくAIも主体となっていき、人間のみであった芸術の表現の場が侵害されるでしょう。特に、二つ目の表現の主体の侵害について述べていきます。現代まで、表現の主体は人間で、人間がクリエイティビティを発揮し作品を作ることしかありませんでした。しかし、これから先、AIもクリエイティビティを発揮する時代が来ると思います。人工知能美学芸術展によると、AIが美意識に目覚め始め、表現者としての立場もAIが台頭してくる、と書かれています。この展では、実際にAIが表現の主体となって作られた作品がいくつも展示されています。人間とAIの芸術の関わり方は四パターン、人間が主体で人間が作成、人間が主体でAIが作成、AIが主体で人間が作成、AIが主体でAIが作成に分けられます。現代では、人間が主体でAIが作成といったパターンがAIと人間の芸術のかかわり方として最も多いですが、いずれAIが主体の2パターンにも遷移していくと思います。
医療分野;
医療分野においては、不利益を被る人々はいないと思います。2016年に実施された転移性乳がんの診断コンテストにおいて、人工知能の誤診率は7.5%、病理医の誤診率は3.5%だったところ、人工知能と医師の診断を併用した場合には、誤診率が0.5%まで減少したという報告がありました。AIと医師が協力することで、医師は負担が減り、患者は高品質な治療を受けることが出来、どちらもWin-winだと思います。また、現代で扱われている医療の情報や知識の量が多くなりすぎていて、一人の人間が知識を正しく扱える量を超えていると言えます。New England Journal of Medicine 2003に掲載された、米国のカルテ分析による医療の質の評価に関する論文によると、検証して「正しい」と言える臨床を行ったカルテ記載は全体の50~80%にとどまるとされています。そこで、AIを活用することで、医療を向上させることが出来ます。また、他の医療分野にかかわる人たちも、医薬品開発や介護をAIに補助してもらうことで、負担を減らすことができ、患者も高品質な医療を受けることが出来ます。
製造業:
AIの導入により、一部の単純作業や品質検査の業務が自動化され、これらの工程に携わる作業者の雇用が減少すると思います。また、需要予測業務に携わる人々の雇用も、AIが導入されることで職を失っていくと思います。特に、単純作業に携わっていた作業者の中でも、スキルアップが難しい作業者たちは、厳しい状況に置かれると思います。
金融分野:
AIの導入により、事務作業や顧客対応が自動化され、携わる従業員の雇用が減少すると思います。また、AIによる市場分析や投資判断が普及すると、株価のアナリストや投資アドバイザーなどの仕事がAIに奪われてしまうと思います。テレビの経済ニュースの時間にアナリストが時折テレビに出てきますが、その仕事も今後なくなっていくと思います
交通・運輸分野: AIやロボット技術の導入により、バス・タクシー・トラックなどの運転手や、倉庫作業員の一部が職を失う可能性があります。また、交通流の最適化により、一部の交通警備員の需要が減少するかもしれません。ただし、AIは交通・物流システムの効率化を支援するものであり、人間の判断力や臨機応変な対応力を完全に代替することはできません。AIと人間が協調し、安全性と利便性を高めていくことが重要です。
農業分野: 農業の自動化・無人化が進めば、一部の農作業に従事する人々の雇用が減少する恐れがあります。ただし、AIを活用した精密農業の実現には、高度な農業知識とデータ解析スキルを兼ね備えた人材が不可欠です。AIの導入で生まれた余剰人員を、農業の高度化や付加価値向上につながる業務に振り向けることが重要だと考えます。
小売・サービス分野: AIの導入により、レジ係や在庫管理、顧客対応など、一部の業務が自動化される可能性があります。その結果、これらの業務に携わる人々の雇用が減少するかもしれません。ただし、AIを活用した業務の効率化は、人手不足の解消や労働環境の改善にもつながります。AIの導入で生まれた人的リソースを、接客の質の向上やきめ細やかなサービスの提供に振り向けることが肝要です。
建設・不動産分野: 建設業界では、AIの導入により、一部の単純作業(資材の運搬など)が自動化される可能性があります。その結果、これらの作業に従事する人々の雇用が減少するかもしれません。また、AIを用いた建築設計の自動化が進めば、一部の設計業務に携わる人々の需要が減る恐れがあります。ただし、建設現場の安全管理や品質管理など、人間の経験と判断力が不可欠な領域も多く存在します。AIと人間が協調し、生産性と安全性を高めていくことが重要だと考えます。
エネルギー・資源分野: AIの導入により、発電所や資源採掘現場の一部の運用・管理業務が自動化される可能性があります。その結果、これらの業務に携わる人々の雇用が減少するかもしれません。ただし、AIはエネルギー・資源システムの効率化を支援するものであり、人間の判断力や突発的な事態への対応力を完全に代替することはできません。AIと人間が協調し、安定的かつ持続可能なエネルギー・資源の供給を実現していくことが重要です。
健康・スポーツ分野: 健康管理アプリや運動支援AIの普及により、一部のパーソナルトレーナーやフィットネスインストラクターの需要が減少する可能性があります。また、スポーツの戦略分析などの分野でAIが活用されれば、一部のデータアナリストの仕事が奪われるかもしれません。ただし、健康やスポーツの分野では、人間の共感力やコミュニケーション能力が非常に重要です。AIを活用しつつ、一人ひとりに寄り添ったサポートを提供できる人材の価値は、むしろ高まると考えられます。
政府・公共サービス分野: 行政手続きの自動化により、一部の窓口業務や事務作業が AIに置き換えられる可能性があります。その結果、これらの業務に従事する公務員の雇用が減少するかもしれません。ただし、AIはあくまで定型的な作業の効率化を支援するものであり、複雑なケースへの対応や、政策立案など、高度な判断を要する業務は人間の領分として残ります。AIを活用した業務の効率化で生まれた時間を、より付加価値の高い住民サービスの提供に充てることが重要です。
宇宙開発分野: 宇宙開発の分野では、AIの導入による直接的な雇用の減少は限定的だと考えられます。むしろ、AIを活用することで、宇宙開発のペースが加速し、新たなプロジェクトや事業が生まれる可能性があります。ただし、AIによる自動化が進めば、一部の単純作業(例:データの前処理など)に携わる人々の仕事が奪われるかもしれません。AIを活用した業務の高度化に合わせて、エンジニアやサイエンティストのスキル向上を図っていくことが重要です。
環境・生態系分野: 環境・生態系の分野では、AIの導入による直接的な雇用への影響は小さいと考えられます。むしろ、AIを活用することで、環境モニタリングや生態系調査の効率が高まり、より多くの知見が得られるようになります。ただし、AIによる自動化が進めば、一部のデータ収集や分析の作業が不要になるかもしれません。AIの導入で生まれた時間を、新たな環境保全活動や、生態系の理解促進に向けた啓発活動に充てることが期待されます。
防災・安全保障分野: 防災・安全保障の分野では、AIの導入による直接的な雇用への影響は限定的だと考えられます。むしろ、AIを活用することで、より高度な防災・安全保障体制の構築が可能になり、社会全体の安全性と回復力が高まることが期待されます。ただし、AIによる自動化が進めば、一部の定型的な監視業務などが不要になるかもしれません。AIの導入で生まれた人的余力を、より専門性の高い分析業務や、現場での対応力強化に振り向けることが重要です。
観光・文化交流分野: AIを活用した多言語翻訳システムの普及により、一部の通訳・翻訳業務が不要になる可能性があります。また、AIによる旅行プランの自動提案が一般化すれば、従来型の旅行代理店の役割が減少するかもしれません。ただし、AIはあくまで語学力や情報処理能力の面でのサポート役であり、人間ならではの創造性や柔軟性、共感力が求められる場面は多く残ります。AIを活用しつつ、より付加価値の高いサービスを提供できる人材の育成が鍵を握ると考えられます。
福祉・介護分野: AIを活用した福祉機器やサービスの普及により、一部の介護スタッフの業務が代替される可能性があります。特に、AIによる見守りシステムの導入が進めば、夜間の巡回業務などが減少するかもしれません。ただし、AIはあくまで介護者の負担軽減と、より質の高いケアの実現を支援するものであり、人間ならではの思いやりや創意工夫を完全に代替することはできません。むしろ、AIの導入で生まれた時間を、利用者一人ひとりとのコミュニケーションや、自己研鑽に充てることで、介護の質を高めていくことが可能になります。
法律・司法分野: AIの導入により、一部の定型的な法務作業(契約書のレビュー、判例調査など)が自動化される可能性があります。その結果、これらの業務に特化した法務スタッフや、法律事務所の補助スタッフの需要が減少するかもしれません。ただし、AIはあくまで法的判断を支援するツールであり、最終的な意思決定は人間の法律家が行う必要があります。AIの活用で生まれた時間を、より高度な法的分析や、クライアントとのコミュニケーションに振り向けることで、法律家の専門性と付加価値を高めていくことが重要です。
- 生成AIの「利益を享受する人々」と「不利益を被る人々」がWin-Winになれる方策を詳しくお答えください(2で不利益を被る人がいないと回答した人は、3は空欄でも構いません)
教育分野:
AIを補助として扱い、効率化された時間を、別の質向上に繋げることで利益を享受する人々と不利益を被る人々がWin-Winになると思います。AIの利用によって出来た時間で、学生との直接的なコミュニケーションやヘルスケアを行うことで、教員の価値をさらに高めることができると思います。また、教材製作会社も、AIを使ったパーソナライズドされた教材製作にシフトすることで、売り上げは回復すると思います。
芸術分野:
AI倫理・ガバナンスを整えること、芸術の表現の再定義を行うことで利益を享受する人々と不利益を被る人々がWin-Winになると思います。芸術家のスタイルを知的財産権として保護する仕組みを整備し、AIによるスタイルの模範が芸術家の権利を侵害していると認められた場合、法的措置を取れるようにすることで、AIによる模倣は制限され、芸術家の独自性はある程度守られるでしょう。また、AIが芸術家の表現の幅を広げるために使われるように、芸術家がスタイルの模倣を許諾する代わりに一定の対価を得られる仕組みなどがあればいいと思います。また、芸術家がAIを活用して新しいスタイルを開発することで、新しい表現を取り入れることも出来ます。表現の主体が侵害されるという話も、AIが主体として表現するという新ジャンルとして取り扱うことで、表現の幅が広がったまま、AI主体の表現と人間主体の表現がすみ分けることが出来ると思います。
製造業:
製造業の現場では、AIの導入により浮いた人的リソースを別の創造的な業務にシフトさせることで、AIに仕事を奪われてしまった作業者にも、新たに職を与えることが出来ると思います。また、AIを活用して業務改善の仕組みを提案し、現場の作業者の知見も生かすことで、製造プロセスを改善し続けることが出来ます。需要予測業務に携わる人々も、さらに付加価値の高い業務に注力できるようになり、生産性の高い仕事ができるようになると思います。
金融業;
金融業の現場では、AIの導入により浮いた人的リソースを別の付加価値の高い業務にシフトさせることが重要だと思います。具体的には、浮いた人員を顧客への対応に割り当てることで、顧客一人一人に寄り添いあったサービスを提供することが出来るようになると思います。また、AIを用いても意思決定をするのは人間であるため、AIを補助的に扱うことで、アナリストや投資アドバイザーも共存していくことが出来ると思います。
交通・運輸分野: 交通・運輸企業は、AIの導入で生まれた余剰人員を、安全運転の教育やサービスの質の向上に振り向けることが重要です。また、自動運転技術の発展に合わせて、運転手の役割を単なる "操縦者" から "モビリティサービスのプロバイダー" へとシフトさせていく必要があります。運転手のリスキリングを支援し、付加価値の高いサービスを提供できる人材を育成することが求められます。物流の現場でも、AIと協働できる人材の育成が欠かせません。
農業分野: 農業従事者がAIを活用して生産性を高められるよう、デジタルリテラシーの向上を支援することが重要です。また、AIを活用した新たな農業ビジネス(農業データ分析、精密農業コンサルティングなど)の創出を促すことで、農業分野の雇用を確保することができるでしょう。農業の自動化で生まれた余剰人員を、6次産業化や農村の活性化につなげる取り組みも求められます。
小売・サービス分野: 小売・サービス企業は、AIの導入で浮いた人的リソースを、顧客体験の向上や新たなサービスの開発に振り向けることが重要です。また、AIを活用した業務の効率化によって、従業員のワークライフバランスを改善することも可能でしょう。 "効率" と "質" を両立させるために、従業員のリスキリングを支援し、AIと協調できる人材を育成することが求められます。
建設・不動産分野: 建設・不動産企業は、AIの導入で生まれた余剰人員を、安全管理や品質管理、顧客サービスの向上に振り向けることが重要です。また、建設現場の自動化に合わせて、作業員の役割を単なる "肉体労働者" から "建設プロセスのマネージャー" へとシフトさせていく必要があります。作業員のリスキリングを支援し、付加価値の高い仕事を担える人材を育成することが求められます。不動産業界でも、AIを活用した新たなサービス(物件の価値向上提案、住環境の最適化など)の創出が期待されます。
エネルギー・資源分野: エネルギー・資源企業は、AIの導入で浮いた人的リソースを、新たなエネルギーサービスの開発や、環境保全活動の推進に振り向けることが重要です。また、AIを活用した業務の効率化によって、従業員の働き方改革を進めることも可能でしょう。 "効率" と "安全" を両立させるために、従業員のリスキリングを支援し、AIと協調できる人材を育成することが求められます。加えて、AIを活用した再生可能エネルギーの普及や、資源のリサイクル推進など、持続可能な社会の実現に向けた取り組みも期待されます。
健康・スポーツ分野: 健康・スポーツ関連企業は、AIの導入で生まれた余剰人員を、個々人に寄り添ったサービスの提供や、新たな健康増進プログラムの開発に振り向けることが重要です。また、パーソナルトレーナーやフィットネスインストラクターには、AIを活用して、より高度で効果的なサービスを提供することが求められます。AIによる定量的なデータ分析と、人間の経験や直感を組み合わせることで、これまでにない付加価値を生み出せるでしょう。スポーツの分野でも、選手やコーチがAIを "強力なサポートツール" として活用し、パフォーマンスの向上につなげていくことが期待されます
政府・公共サービス分野: 政府・公共機関は、AIの導入で浮いた人的リソースを、より複雑な市民ニーズへの対応や、新たな行政サービスの開発に振り向けることが重要です。また、AIを活用した業務の効率化によって、公務員の働き方改革を進め、ワークライフバランスの向上を図ることも可能でしょう。公務員の AIリテラシーを高め、AIを活用した高付加価値なサービスを提供できる人材を育成することが求められます。加えて、AIを活用した参加型の政策立案プロセスを導入するなど、市民との協働を促進することも重要な課題だと考えます。
宇宙開発分野: 宇宙開発企業は、AIの導入で生まれた余力を、新たな宇宙ビジネスの創出や、より野心的な探査ミッションの実現に振り向けることが重要です。また、AIを活用した業務の高度化に合わせて、エンジニアやサイエンティストのリスキリングを支援し、より創造的な仕事に取り組める環境を整備することが求められます。加えて、AIを活用した宇宙開発の成果を、地上の産業や社会課題の解決に役立てる取り組みも期待されます。宇宙技術の地上への展開を通じて、より多くの人々がAIの恩恵を実感できるようになるでしょう。
環境・生態系分野: 環境保護団体や研究機関は、AIの導入で生まれた時間を、新たな環境保全活動や、生態系の理解促進に向けた啓発活動に充てることが重要です。また、AIを活用した環境モニタリングや生態系調査で得られたデータを、オープンに共有し、多様なステークホルダーの参画を促すことも求められます。市民、企業、政府が協力し、AIを活用した持続可能な社会づくりを進めていくことが肝要だと考えます。加えて、AIを環境教育に活用するなど、次世代の環境リーダーを育成する取り組みも期待されます。
防災・安全保障分野: 防災・安全保障の関係機関は、AIの導入で生まれた人的余力を、より高度な分析業務や、現場対応力の強化に振り向けることが重要です。また、AI技術を活用して、地域コミュニティとの協働による防災・減災活動を促進することも求められます。住民一人ひとりが、AIを活用した防災スキルを身につけ、自助・共助・公助の輪を広げていくことが、より強靭な社会の実現につながるでしょう。加えて、AIを活用した安全保障技術の民生利用を推進し、社会の安全・安心に役立てていくことも期待されます。
観光・文化交流分野: 観光業界は、AIの導入で浮いた人的リソースを、より創造的で付加価値の高いサービスの提供に振り向けることが重要です。例えば、AIを活用して旅行者の嗜好を深く理解し、一人ひとりに合ったきめ細やかなおもてなしを実現する。そうした "人ならでは" のサービスを磨くことで、従来型のビジネスを脅かされるどころか、新たな価値を生み出すことができるはずです。また、文化交流の面でも、AIを活用した異文化理解の促進や、地域の文化資源の魅力発信など、新たな可能性が広がります。観光業に携わる人々が、AIという強力なツールを味方につけ、創造性を存分に発揮できる環境を整備することが肝要です。
福祉・介護分野: 福祉・介護の現場では、AIの導入で浮いた人的リソースを、利用者一人ひとりとのコミュニケーションや、自己研鑽に振り向けることが重要です。また、AI技術を活用して、介護スタッフの働きやすい環境を整備することも求められます。例えば、AIを用いた最適なシフト管理により、介護者の Work-Life Balance を改善する。そうした取り組みを通じて、介護の質を高めつつ、従事者の負担軽減と専門性の向上を図ることが可能になるでしょう。加えて、AIを活用した新たな福祉サービスの開発や、地域コミュニティとの協働を促進することで、誰もが生き生きと暮らせる " 優しい社会 " の実現につなげていくことが期待されます。
法律・司法分野: 法律事務所や企業の法務部門は、AIの導入で生まれた時間を、より専門性の高いリーガルサービスの提供や、クライアントとの信頼関係の構築に振り向けることが重要です。また、AIを活用して、社会の変化に即した新たなリーガルサービスを開発することも求められます。例えば、AIを用いたスマートコントラクトの策定支援や、オンライン紛争解決システムの構築など、技術の進歩に法的な側面から貢献していく。そうした取り組みを通じて、法律家の付加価値を高めつつ、国民の司法アクセスを改善することが可能になるでしょう。加えて、AIを活用した法教育の充実や、市民との対話の促進により、より開かれた司法の実現につなげていくことも期待されます。