はじめに
この記事は,農工大アドベントカレンダー18日目の記事です.
僕以外の記事はみんな技術系でしたが,なにぶん僕にはその技術力が全く足りないので,めげずに得意分野で頑張ることにしました.
本記事の内容
- 現在の生成AI事情の宣伝
- 生成AIとその主な活用方法の紹介
目次
生成AIとは
生成AI,使ってますか使ってますよね使うに決まっていました当然でした.ますます情報化が進む昨今,自然言語処理分野の研究における大きな副産物の一つとして得られたのが生成AIです.そこからは怒涛の勢いで他分野との融合が進んでいき,画像生成や音声生成,動画生成までもがプロンプト一つで簡単に実行できます.
既に世界はもう,生成AIと切っても切れないところにまで踏み込んでいます.ChatGPTが10分程度処理落ちすると,X(旧Twitter)ではすぐにその旨のツイートがたくさん流れてくる.これは,現代人が生成AIなくして生きていくことはできない,すなわちインフラとして生成AIが機能してるとまで言えるでしょう.
そうなれば話はシンプルです.知識がものいう現代では「使えるものは全て使った者が勝ち」です.よって,この記事から現代の生成AIの潮流をつかみ,それらを積極的に活用していくべきです.
前置きが長くなりましたが,エンジニアも非エンジニアも読みやすい内容となるように心がけたので,ぜひぜひ楽しみながら読んでいただけると幸いです.
以下,生成AIの歴史についてまとめましたが,完全に自己満足のかたまりなので,読みたい人だけどうぞ.
生成AIの歴史
AIは元々,アラン・チューリングが「チューリングテスト」や「汎用計算機」のアイデアを提唱したことから始まりました.初期のAIは単純な問題解決プログラムに焦点を当てており,決められた行為の自動化が目的でした.その後,ルールベースのAIシステムからデータ駆動型とする手法が普及していき,DNNが成功したことでディープラーニングが注目を浴びました.そして2020年,生成AIがの代名詞であるChatGPTが登場したことで,エンジニア以外の一般人にまで生成AIが広がりました. 生成AIはデータのパターンや関係を学習し、新しいコンテンツを生成することを目的としています。そのため,初期のAIが開発されていた時とは比べようもないほど広い分野に浸透したわけです.生成AIスーパー紹介タイム
以下,ひたすら生成AIを紹介していきます.なお,ほぼ全ての生成AIはどこかのタイミングでお金を請求してくるものですが,ここでは基本無料のものに絞って紹介します.また,無料によってかけられる制限も合わせて述べます.
1. 生成AIの王様,ChatGPT
[概要]
言わずと知れたChatGPT.チャッピーやGPTの愛称でお馴染みであり,既に使用したことのある人が多いかと思います.
「Generative Pre-trained Transformer」という言語モデルを基にしており、大量のテキストデータをもとに学習しています.これにより,自然な対話はもちろん,文章生成や画像生成,翻訳まで簡単に任せられます.
そんな ChatGPTですが,その ver を意識しながら使ったことはあるでしょうか.実は, ver によってその機能にかなり違いが生まれます.以下に,簡単にまとめてみました.
- 無料版
- GPT-3.5
- 基本的なタスク(テキスト生成,会話,翻訳など)は全て実行できる
- GPT-4o mini
- GPT-4o の2倍の応答速度を誇る
- テキストと画像のみに対応
- GPT-3.5
- 有料版
- GPT-4o
- OpenAIの最新AIモデルとして,最高レベルの性能を見せる
- テキストと画像に加えて,音声や動画も扱えるなど,マルチモーダルに特化
- OpenAI o1
- OpenAIの最新AIモデルとして,最高レベルの性能を見せる
- 複雑な問題解決と高度な推論に特化
- プログラミングや難解な数学の問題に優れる
- 応答速度がとても遅い
- OpenAI o1-mini
- OpenAI o1 の3~5倍の応答速度を誇る
- 理数系分野に特化し,その他の知識を排除
- 応答速度が少し遅い
- GPT-4o
[使用法]
- ChatGPTの公式サイトにアクセス
- 表示されるチャット欄にプロンプトを入力
[活用例]
自然な対話の中で画像生成を頼んだところ,簡単に条件に合った画像を生成してくれました.
[注意点]
- 無料版は,以下の場合に制限があります
- 使用できるのは GPT-3.5,GPT-4o mini,GPT-4o の3種類
- 初回は GPT-4o が使用できるが,以下の場合に GPT-4o miniに切り替わります
- 入力可能な文字数 : 2048文字
- 質問は1分あたり60回まで
2. 細かいところに手が届く,Claude
[概要]
名前は見たことあるけど,使っている人は多くなさそうなChat AIであるClaude(クロード).実はChatGPTよりも幅広いことを行うことが可能です.
例えば,ChatGPTに頼むよりもプラスで詳細かつクリエイティブな内容を出力...してくれるらしい.ただ Claudeの活用例を見たら分かる通り,プログラム等を出力する際はChatスペースと分けて出力してくれるのがかなりUIとして仕上がっていて使いやすいです(つい最近,ChatGPTもマネしましたし).
また,「◯◯について詳しく解説するリッチなスライドショーを作成して」と頼むと,ブラウザ上で作成した資料を見ることができます.これはpptx形式で出力し直せるため,大変有用です.
まとめると,ChatGPT+αの要素を多く持つのがClaudeの大きな魅力となります.視覚的なコンテンツを作成する際には,使ってみるか検討する価値があります.
[使用法]
- Claudeの公式サイトにアクセス
- 表示されるチャット欄にプロンプトを入力
[活用例]
「地球温暖化について詳しく解説するリッチなスライドショーを作成して」とお願いしてみました.
簡素ではありますが,このレベルの資料を一瞬で生成してくれます.加えて,「もっとスタイリッシュにして」などと伝えれば,より自分好みのスライドを作成してくれるでしょう.
[注意点]
- 一日にChatできる回数に制限があり,上限となると20:00まで使用できなくなります.
- ChatGPTよりもできることが幅広いので,基本はChatGPT,ここぞというときはClaudeという使い方がいいかもしれません.
- 無料版は,以下の場合に制限があります
- 使用できるのは Claude 3.5 Sonnet のみ
- 約4〜5時間ごとに10回程度のメッセージ送信
- アップロードできるファイルの容量に制限(数MBなら大丈夫)
3. 究極の回答AI,Perplexity
[概要]
一般ユーザはほとんど耳にすることも少ないであろうPerplexity(パープレキシティ).発音ムズすぎ.「perplexity」自体は「困惑,複雑」等の意味があり,どんな質問に対しても明確に答えようという意味が込められているらしいです.Perplexity自身に聞いたので間違い無いはず.
そんなPerplexityの魅力は 「検索して,回答を生成する」ことにあります.従来のChat AIでは,膨大なデータを蓄積することでプロンプトに対する回答を生成しました.
一方,Perplexityは毎回検索を行い,適切な情報収集を行なった末に回答を生成してくれます.さらに,回答を生成した際には,「この部分はこのサイトを参考にした」というように根拠を提示します.つまり,自身がネットサーフィンすることなく,取捨選択され,よく咀嚼された,必要な情報のみを,ある程度の信頼性を保ったまま作成してくれます.素晴らしすぎる.研究のお供.
さらに,Perplexityには「Pro Search」と呼ばれる機能があります.回数制限こそあるものの,複雑な質問に対して多段階推論や高度な数学能力を使って詳細な回答をしてくれます.しかも,使いたいときは右下のトグルをクリックするだけなので,ここぞというタイミングに絞って利用することができます(Claudeでは毎回環境設定の奥底に潜らなければならないので,とても簡単.そうです.Claudeは噛ませ役です).そのため,研究分野やクリエイティブな作業を行う際にもPerplexityは十二分の働きを見せてくれます.あんた,神か.
[使用法]
- Perplexityの公式サイトにアクセス
- 表示されるチャット欄にプロンプトを入力
[活用例]
「地球温暖化について教えて下さい」とお願いしてみました.
超詳細な解説をしてくれるのはChat GPTやClaudeと変わらないですが,重要なのは文中に小さく書かれている①や②といった数字です.これらをクリックすると,その情報の提供元であるリンク先に飛ばしてくれるので,簡単に情報ソースを確認することができます.
当然ながら,情報ソースは英日関係なく探した上で,それをユーザー向けに整形して出力します.当てのないネットサーフィンにもう行く必要はもうありません.
[注意点]
- 通常のChatであれば,その回数に制限はありません
- 無料版は,以下の場合に制限があります
- Pro Search: 4時間ごとに3回まで利用可能
- ファイルのアップロード: 1日3回まで
- 検索したサイトからの情報に完全依存なので,サイトが間違っていると情報の信頼性が著しく下がります,
- 名前が長い上に「複雑」なので,タイポや読み間違いが頻出します.
4. 情報抽出マシン,NotebookLM
[概要]
「Notebook(ノート) + LM(言語モデル) = NotebookLM(情報整理任せろモデル)」みたいな感じ?だと思います.由来見当たらなかったので当て勘ですが.
NotebookLMはアップロードした文書から情報を抽出することに長けています.例えば,英語で書かれた10p超えの論文などは,「その概要をざっくり把握したい,しかしAbstractだけでは少し物足りない」といったことが頻発します.その際,文書をアップロードすれば全体の概要を簡単に把握できます.
また,多彩な入力を受け付けていることも魅力です.pdf,txt,Markdownはもちろん,mp3,ウェブサイト,Youtubeのリンクまでなんでもござれです.その全てにおいて,概要をざっくり把握した上で回答を生成してくれます.
Perplexityとの差異として,NotebookLMは情報ソースをアップロードした文書のみとすることです.これにより,情報ソースへの依存度100%のChat生成AIの完成です.あとはその文書についてChat形式で質問しまくれば良いわけです.NotebookLMで「閉じた情報」を得つつ,Perplexityで「開いた情報」を得ると相乗効果は無限大.相性ピッタリ.
また,注意点を読んだら分かりますが,無料版の制限もあってないようなものです.ぜひ使いまくりしょう.
[使用法]
- NotebookLMの公式サイトにアクセス
- ノートブックを作成する
- 左上の+マークからソースを追加
- 様々な方法で利用
- 勝手に表示される概要の把握
- 表示されるチャット欄にプロンプトを入力
[活用例]
Googleの利用規約(日本語版)をpdfとしてダウンロードし,NotebookLMにアップロードしました.
画像の通り,何もせずとも勝手に概要をまとめてくれました.
また,簡単なプロンプトを入力してみます.
めちゃくちゃ詳細に教えてくれました.しかも,情報ソース中のどの箇所なのか明示してくれているので,すぐに確認しやすい.あまりにも完璧すぎる.
[注意点]
- 無料版は,以下の場合に制限があります.
- アップロードできるソースの数: 最大50個まで
- 1つのソースに含められる単語数: 最大50万語まで
- PDFファイルの容量制限: 100MBまで
- 個人情報,著作物のアップロードは禁止
- アップロードさえできれば,それについてChatの回数などに制限はありません.
5. イカした図を量産しまくる,Napkin AI
[概要]
色々な人の発表資料を見ると,えげつなくカッコいい図やグラフ等があると思います.かといってそこまでこだわると,時間的制約が厳しかったり...
そこで,テキストベースで視覚的コンテンツを生成するのが Napkin AI です.これは活用例を見ないと凄さが伝わりにくいかもですが,頑張って文字にしてみます.まずはその表現力の高さです.一つの題材に対して,これほど多くの表現方法があるのかと驚かされるほどいっぱいあります.しかも色やフォントなどのカスタマイズ性もかなり広く,どれもびっくりする出来です.次に...いやまぁそんな感じですね.言葉にすればこれだけですが,そのクオリティに圧倒されるのが全てなので.あとは,pngやpdfなど好きな出力形式を指定できるので,pptxやFigmaにも貼りやすいです.細かいところに手が届く.うん.
[使用法]
- Napkin AIの公式サイトにアクセス
- 以下の2つのうち,一つ選ぶ.そこで入力された内容をもとに,視覚的コンテンツを生成する
- Draft with AI
- 表示されるチャット欄にプロンプトを入力
- AIがその内容について要約文を自動生成する
- Blank Napkin
- 空の文書に情報を入力
- Draft with AI
[活用例]
「Draft with AI」に「食糧危機について」というプロンプトを入力しました.
なんかそれっぽい図が出来上がりました.しかも図左のタブを見ると分かる通り,同じトピックについてあらゆる表現を尽くしています.
この図の中に猫を埋め込んだりとカスタマイズ性もある程度担保されています.資料作成においてとても有用なツールになること請け合いです.
[注意点]
- 無料版は,以下の場合に制限があります
- 無制限の資料作成が可能
- 日中モードと夜間モードの両方が利用可能
- 一部,カスタマイズ機能がロックされる
※ 現在(2024/12/9)はプロフェッショナルプランまで無料なので,そちら準拠で紹介
6. AIアプリを知識ゼロで作れる不思議な場所,Dify
[概要]
AI,現代で最もホットでロックであちちな話題ですが,大多数の人はそれを使うだけ,もしくは全く触れないかもしれません.それはやはり,AIを勉強するハードルの高さもさることながら,その実装をすることがめちゃくちゃ大変だからでしょう(実際,著者は苦労している真っ最中です).
Difyでは,そんなAIを使ったアプリケーションを,なんとノーコードで作ることができます.これにより,プログラミングスキルがない一般ユーザーも発想一つでなんちゃってエンジニアです.また,この簡便さはプログラマーにもメリットです.一般ユーザーが簡単なAIアプリを作れるのならば,普段からプログラミングに慣れ親しんだプログラマーは複雑なAIアプリを作れるに決まっています.ぜひ一度試してみる価値はあると思います.
[使用法]
- Difyの公式サイトにアクセス
- チャットbot / エージェント / ワークフローから選ぶ
- アプリを作成する
- 最初から作成する
- テンプレートから作成する
- DSLファイルをインポートする
[活用例]
こちらの記事を参考に,台本作成AIを作成してみました.
感想としては,「こんなボタンをぽちぽちするだけでAIを用いたアプリを使えて,なんなら公開まで出来てしまうのすごすぎる」です.圧倒的汎用性の高さが魅力なので,AIを触ってみたい,勉強してみたい人は気軽に使える優れものです.
[注意点]
- 無料版は,以下の場合に制限があります.
- 最大10個までのアプリを同時開発可能
- チームメンバーは1人まで
- 最大50件までのドキュメントをアップロード可能
7. 空想のキャラクターと会える,Character.ai
[概要]
僕はアニメが大好きです.一番好きなアニメはぼっち・ざ・ろっく!ですが,他にも呪術廻戦やFate,パリピ孔明などたくさん見ます.そこで毎回感じるのは,やはり創作物という点です.物語の中でしか呼吸をしてくれない以上,現実世界にいる僕と自由にコミュニケーションをとることはどうあがいても叶いません.
しかし,AIにそのキャラクターを模倣してもらうことでそれが叶うようになりました.
ここで,生成AIの使用者によるランキングを見てみましょう(ここで?).なお,このランキングのURLは参考文献に貼ってます.
これを見ると,Web版のランキングではcharacter.aiはChatGPTに次いで2位になっていることがわかります.つまり,それだけここで作れるキャラクターたちは本当に血が通っている人間のように振る舞ってくれるわけです.そして,それにはこれだけの需要があるわけです.ぜひcharcter.aiを使って,自分だけのキャラクターを作ってみましょう.
[使用法]
- character.aiの公式サイトにアクセス
- 左上の「Create」->「Character」をクリック
- 自分好みのキャラクターとなるようにこだわる
[活用例]
適当な設定のもと,新キャラクターのBob君を作りました.以下,彼とのChatの内容です.
とっても仲良しです.
... character.aiの公式サイトには,既に作成されたアニメキャラや有名人などのモデルがたくさんあるので,初めはそちらで楽しむのもアリだと思います.
[注意点]
- 無料版は,以下の場合に制限があります.
- 応答速度が標準で,待ち時間が生じることもある
- カスタムキャラクターの作成は1日あたり5体まで
8. 10秒で高クオリティの曲を作る,Suno
[概要]
僕はアニメが大好きです.一番好きなアニメはぼっち・ざ・ろっく!ですが,(中略),音楽の世界に興味を持った人は少ないはず.X(旧Twitter)にも,ぼっちちゃんが使っていたLes Paulが売りに出された様子が話題になりましたし...
しかし,これだけ売りに出されてしまうほど,楽器の練習を行うのは大変であったことも事実です.そこで,出てくるのが Suno です.Suno は誰でも簡単に曲を作れることはもちろん,ほんのり自分色にカスタマイズすることもできます.また,小ネタとして使うこともできる,面白い生成AIです.
[使用法]
- Sunoの公式サイトにアクセス
- 左上の「Create」をクリック
- 左上の「Custom」のトグルをオンにする
- 「Lyrics」「Style of Music」「Title」を入力する
- 左下の「Create」を押す
[活用例]
自分で歌詞を考えるのは恥ずかしかったので,ChatGPTに頼んで,「Lyrics」「Style of Music」「Title」を全て生成してもらいました.テーマはお察しの通り,「地球温暖化について」です.
ChatGPTに考えてもらった歌詞等
Title 未来のためにStyle of Music
バラードでポップ
Lyrics
(Verse 1)
青い空が遠くなる
波が海岸を飲み込んでいく
静かな街が声を失い
風が運ぶ 熱い涙
小さな手が未来を描く
大地はまだ眠りたいのに
火をつけたのは誰?
止められるのも私たちだ
(Chorus)
いま 立ち上がろう この星守るため
ひとつの世界 つながる命
まだ遅くはない 変えられる未来
地球の声に耳をすまして
(Verse 2)
森は息を止めかけて
氷が溶けて流れ出す
空っぽになった動物たちの家
「戻れるかな?」そんな問いかけ
小さな選択が 大きな波になり
君と僕の力 合わせれば
目をそらさないで この瞬間を
きっと新しい風が吹くから
(Chorus)
いま 立ち上がろう この星守るため
ひとつの世界 つながる命
まだ遅くはない 変えられる未来
地球の声に耳をすまして
(Bridge)
燃える太陽の下に
芽吹く希望の花を咲かせよう
私たちが選ぶこの道
笑顔の明日へ続いてる
(Chorus)
さあ 立ち上がろう 光を手にして
ひとつの未来 つながる心
まだ遅くはない 変えられる未来
共に歩こう 地球のために
(Outro)
青い空はまだ 待っている
誰かの愛を 待っている
未来はきっと 輝いてる
君のその手で つくろうよ
これらを全てSunoに入力したら,こんな画面になります.
1回生成させると,2個の曲を10秒程度で生成してくれます.試しに生成した曲をこちらに挙げてみます.
どの曲もクオリティ高すぎる...バラード一つでここまで自分の感情を揺さぶられると思ってませんでした.しかもこれらの曲たちを,さらに自分好みになるようにプロンプトを調整できることも考えると,あまりにも夢が広がりすぎます.試作した曲を聞いて興味の出た人は,一度自分でも生成してみることをお勧めしたいです.
[注意点]
- 無料版は,以下の場合に制限があります.
- 1日に最大10曲まで生成可能
- 商用利用不可,著作権もSuno AI
- 生成する音楽の品質が標準のみ
生成AIの注意事項
最後に,生成AIの使用にするにあたっての注意を置いておきます.生成AIからなんらかの回答を得ようとする場合,必ずといっていいほどある文言が書いてあります.ここではChatGPTを例に挙げてみます.
そうそう,「What can I help with?(なにかお手伝いしましょうか?)」つまりこれから回答してもらう前口上...ではなく,そのもっと下です.一番下.うすーい文字でなにか毎回書かれています.
「ChatGPT can make mistakes. Check important info.(ChatGPTは間違えることがあります.重要な情報は確認してください)」.普段気にも留めませんが,実はいつも最下端にちょこんと置いてあります.この文章の意図は以下の2点に集約されます.
- 生成AIは完璧ではないので,間違えることがある.
- 二次情報のみでなく,一次情報を確認するべきである
ここまで多くの生成AIを見てきましたが,完璧と呼べるものはこの世にまだ一つも存在しません.これは大言壮語でもなんでもなく,生成AIに限界が存在することを示唆します.理由は様々ですが,例えばデータの限界等が挙げられます.生成AIは過去のデータを基準に学習するため,データに偏りや誤りが含まれる場合に間違った出力がなされることがあります.また,過去のデータを基準にするということは,今まさにこの世界で起きていることについては正しい回答が行えないということです.(Perplexityのことは一旦考えないとすると)
このように,生成AIから得られる情報はあくまで二次情報であるため信頼性が心許ないです.そのため,何かしらの回答を得た後もそこで止まらず,その根拠となる情報を改めて探しにいくべきである.これこそが「ChatGPT can make mistakes. Check important info.(ChatGPTは間違えることがあります.重要な情報は確認してください)」.に込められた意味となります.
終わりに
ここまで長文の記事を書いたのは初めてでした.正直疲労困憊です.
読者の方は,たとえ飛ばし飛ばしだとしてもここまで読んでいただき本当にありがとうございます.全部読んでくれた方については神様です.
AIはこれからもますます発展していき,日々の生活を豊かにしていくでしょう.そのため,ここで紹介したAIを利用して情報リテラシーを高めるとともに,AIが生活に溶け込んだより便利な世界を楽しんでください.
あと,卒論書いてくれる生成AIはまだですか???
参考資料
[概観]
The Top 100 Gen AI Consumer Apps 3rd Edition
[ChatGPT周辺]
ChatGPTとは? 始め方や賢い活用方法などわかりやすく解説
[Claude周辺]
一歩進んだプレゼンテーション - Reveal.js Tips -
[Perplexity周辺]
Perplexity AIで驚くほど簡単に!情報検索の新時代が到来
[NotebookLM周辺]
NotebookLM(ノートブック エルエム)とは?使い方まで徹底解説!
[Napkin AI周辺]
Napkin AIとは?使い方や料金、商用利用について解説!
話題のNapkin AIとは?テキストから図解を作成!無料で使えるのか料金も解説
[Dify周辺]
【2024年最新】Dify入門ガイド:誰でも作れる最新AIアプリ開発
Difyとは無料で生成AI開発できるツール!使い方や商用利用ついても解説
[Character.ai周辺]
character.aiとは?実際に使用し、キャラを作ってみた!