概要
最近気になっていたモデルを三つ試してみたというだけの記事を書きます。
試したもの3つ
- 日本語対応のStable Diffusion
- Microsoft Office 365 のwordの議事録機能
- Text to Pokemon生成AI
日本語対応のStable Diffusion
こちらにプレスリリースが載っていたので試してみました。
Huggingface に使い方が載っています。
ただし、チュートリアルどおりに進めると、小さなバグがあったため、Github のissue をみて解決しました。
Google Colab で試した結果が下の通りです。
結構色々遊べそうですね、、!
Microsoft Office 365 のwordの議事録機能
議事録を簡単にとってくれるサービスにはどんなものがあるのだろうと思っていたのですが、
いくつか試した中ではOffice 365 のword が一番優秀でした。
ブラウザ版のwordの、Dictateのセクションから、Japaneseを選択してマイクのボタンを押すと、
音声をwordファイルに書き出してくれます。
雑談した結果がこれ。そこそこいいですが、惜しいなという感じです。
しかしながら、他のサービスはこれにも満たないくらい残念な結果だったので、Microsoftはやはりすごいなと思います。
まあちょっと今行けるかわからんけどまあけっこう声が大きければ割とちゃんと取ってくれるっていう感じ結構すごいですよ。
でなんかこれをそのままえっと捨てボディビジョンに入れたらどうなるんだろうっていう王の考えてそれはもうなんか実はあるものの安芸合わせで出来るんじゃないと思ったけどまあまあまあムズイっていう。
なんかその単語やったらいいけどこれ文章をなんかあんだけ長いやつを煎じぐらい一気にばんって入れたら全然できんくてやっぱ無理なんや。
これやっぱ句読点は出てこないよね。
丸入れるのももしかしたらできたかもしれ。
ああ、なんかちょっと微妙か?廣瀬家。いやね、これすごいのがその言語を結構選べるっていうのが、映画だったらもっと多分。
ああ。でなんかこれで思ったのが、その。自分が座っているところで自分が喋ると多分結構音拾ってきちんといいんやけど、
なんかあっちでしゃべってる人が喋ると多分制度いけないパンしてだからなんか。
人による。人によって、場所のその。マイクとかが多分一番いいかなっていう。結構いいよ。
Text to Pokemon生成AI
最後に、
を眺めて面白そうだった、テキストからポケモンを生成するモデルで遊んでみました。
結構面白かったので遊びたい方はぜひみてみてください。
まとめ
今回は気になったSaaS型のAIでいろいろ試してみただけの記事になってしまいましたが、
ほんとうにいろんなモデルが無料である程度使える世の中になっていて、
AIモデルを学習したり、自分で作るという目的ではなく、使い倒す、という観点で言うと
本当にたくさんのことができるということを実感しました。
最先端のモデルが膨大な量のデータを捌いているのを目の当たりにして、これからどんな世の中になるんだろう、
というふうに考えた1日でした。
今回はこの辺で。