Y子です。
去年までは、いわゆる生成AIというものに、ほとんど触れていなかったと思います。
それが今年は、なんだかんだでいろんなAIに触れた1年でした。
記録を兼ねて、これらを振り返っておこうと思います。
無限もじおこし (iPhoneアプリ)
一番最初に日常使いを始めたAIと言えば、この「無限もじおこし」というアプリです。
正確には、2024年11月から使い始めていました。
「耳で学ぶAI」というPodcast番組の、このアプリの開発者さんをゲストに迎えていろいろ聞いている回があり、これで知りました。
リアルタイム音声の文字起こしだけなら無料で、録りためた音声ファイルからの文字起こしなら月額500円で、使えます。
わたしはこれまで、iPhoneのボイスメモにいろいろなメモを録りためており、テキスト化の方法に悩んでいましたが、この解決にピッタリのアプリでした。現在も、何かと重宝しています。
ChatGPT
今年の5月から使い始めましたが、もうすでにこれ無しでは生活が厳しい気がしています…。それほどまでに、様々なシーンで、ChatGPTを使う前提で行動しています。
たとえば、何かの用語を、意味や用例、関連する技術分野を含めて知りたいとき、ChatGPTに聞いてしまいます。
不慣れな言語でツールを作りたいとき、用途を伝えてコードを出力してもらい、少々の手直しで用に足るものができてしまいます。
コーディング中にエラー原因がわからない場合、エラーの文面をChatGPTにペーストしてヒントをもらったり、コードをペーストして改善箇所を指摘してもらったりしています。
パワポ用にちょっとした画像が欲しいとき、ChatGPTに画像を生成してもらいます。人物だったり、壁紙だったり。「背景を透過して」と指示すると透過pngで出力してくれるので、他の要素と組み合わせやすくなります。
ちょっとしたアイディアをふくらませるための壁打ちに使ったり、ネットで見つけた大喜利に参加するために「○○で始まる単語を10個列挙して」とお願いしたり。
最近、写真を面白く加工するプロンプトを公開しているクリエイターさんがいて、それを借用して画像加工してみると、びっくりするような良い画像が出来上がります。
いままで、専用のサービスやソフトが必要だったプロセスや、相当な学習コストをかけて身に着ける必要があったスキルが、ChatGPTを使うという一つのスキルに集約されるような感覚があります。
これが今後進化しているとしたら、私たちの生活はどう変わっていくんでしょう。楽しみでなりません。
5月から月額3000円で使用していましたが、「プロジェクト」機能が無料ユーザにも開放された9月頃から無料で使っていました。しかしすぐに上限に達してしまうため、11月から課金を再開しています。
NotebookLM
テキストなどを与えると、音声コンテンツにしてくれたり、インフォグラフィックを作ってくれたり、スライドを作ってくれたりするやつです。
私はこれにハマりました。
ちょっと長いWeb記事を、事前にこれで音声化しておき、移動中にゆっくり聞くという習慣ができました。
誤読がひどいときは、音声作成時に
「大晦日」は、すべて「おおみそか」に言い換えてください。
などと指示してあげれば、そこそこ従ってくれます。
誤読にパターンがありそうですね。
1文字目を、別の読み方の1文字目に置き換えるタイプの誤読がよくあります。
「縮図」を「ちくず」と読んだり。 (しゅくずの「しゅ」が、ちぢむの「ち」に)
「豊作」を「とうさく」と読んだり。 (ほうさくの「ほ」が、とむの「と」に)
今後改善されていくといいなあ。
インフォグラフィックも、驚くほどきれいにまとめてくれて嬉しいですが、変な文字化け?がありますよね。
ためしに、わたしのQiitaのトップページと、「バッチファイルでzip圧縮する(PowerShellを使用)」のページを画像にまとめてもらいました。
Google Gemini
10月から、Google AI Pro(月額2900円)に課金し、NotebookLMとGeminiを有料で使っています。
Geminiは、今のところ画像生成にしか使ってないですね…。
ChatGPTの画像生成は、次々と指示を出して画像を変化させていく中で、指示していない部分まで変わってしまい、なかなか期待通りの結果が得られない事象が頻発します。
一方Geminiでは、指示した変更だけを行ってくれる印象で、少しずつ変化させて目的とする画像に近づけることができます。一方で、画質が低く、右下にGeminiのマークが入ります。
なんとなくですが、Geminiで荒い画像を作成し、ChatGPTでそれを清書してもらう、のような組み合わせ方ができればいい気がしています。
Suno
12月から、音楽生成AIのSunoも試してみました。
Proプラン月額1500円で、2500クレジット分の操作ができます。
スタイルなどのプロンプトを与えて生成の操作を行うと、10クレジットを消費して2曲生成してくれます。
なので、1ヶ月に250操作500曲が作成できる計算です。
友人のバンドの曲の使用許可を得て、様々なアレンジのインスト版を生成してみました。
ブラスバンド風やら、弦楽四重奏風やら、ハードロック風やら、スターウォーズ風やら…。
思いのほか壮大だったり繊細だったりして、めちゃくちゃ楽しい。ちょっと高い食事ぐらいの料金で、こんなに遊べるなんて、私は感動しています。
歌詞を与えることもできますが、メロディに合わない歌詞の詰め方をされることが多く、またメロディが変わるCメロでてきとうなメロディに置き換えられることが多く、思い通りに歌ってもらうのは大変です。単純で短い曲ならいいのかもしれません。
ChatGPTなどと違い、日常のインフラというわけではありませんが、当分遊び倒したい気がします。
その結果、かかるお金は…
| AI | 月額 |
|---|---|
| 無限もじおこし | 500円 |
| ChatGPT | 3000円 |
| Google AI Pro | 2900円 |
| Suno | 1500円 |
月々7900円かあ…。
使わない月でもかかる固定費にしちゃうと、ちょっと高いかもですね…。
1か月単位で延長するような使い方がいい気がしています。
来年は、どんな技術との出会いがあるのか。楽しみです。

