更新履歴
- 2022/09/11 Power Platform を追加
- 2022/10/01 Custom Vision を追加
本文
今日は、こちらの記事の更新版を書いていこうと思います。
前の記事を書いてから2年近くたっていて本当に状況が変わっています。時がたつのは早いですね。
本記事の目的
ハッカソンはアイデアを短期間で実装することが肝なので、アイデアのコア部分の実装に集中して周辺の付帯的な部分はありものを組み合わせたり、バックエンドが必要なときはクラウドの PaaS や FaaS 系のサービスあたりを使ってさくっとデプロイしてしまいたい所ですよね。なので、この記事ではそういった用途に使い勝手のよさそうなサービスをざっと紹介しようと思います。
AI 系サービス
Azure Cognitive Services というブランドでいろいろなサービスが提供されています。
これは基本的に事前にトレーニングされた AI を Web API として呼び出せる形でデプロイできます。中には少しカスタマイズしたりしたうえで API としてデプロイできるものもあるので使いようによってはとても面白いものができるかもしれません。いくつか使い勝手のよさそうなものをピックアップしたいと思います。
使い方の流れ
色々ありますが、どれも Azure のポータル (https://portal.azure.com) で自分が使いたい API に対応するリソースを新規作成して、エンドポイントと API キーを取得して、それを使ってアプリケーションから REST API を叩くか各言語ごとに提供されている SDK を使って呼び出す形になります。
普通の API を提供しているサービスだと利用登録をしてキーを発行というような流れになると思いますが、それとは少し違うので気を付けてください。各サービスごとにクイックスタートのドキュメントのリンクをつけているので、興味のあるサービスがある場合は Azure のアカウント (サブスクリプション) を作った後にクイックスタートの手順に従ってセットアップしてみてください。
音声系
音声からテキストへの変換
最近はモバイルデバイスで音声からテキストに変換するような機能もあったりしますがサーバーサイドで音声からテキスト変換をしたりするケースやマイク以外からの入力(音声ファイルなど)でも文字おこしをしたいといったものに使えます。
各言語向けに SDK も提供されていたり、サンプルも GitHub で公開されているので、ある程度プログラムを書ける人であれば、このクイックスタートのドキュメントを開いて自分の使いたい言語のタブを開くのが一番わかりやすいと思います。
テキストから音声への変換
逆に喋らせたい!!という場合にはテキストから音声への変換を行うこともできます。
こちらも同様にクイックスタートに各言語での使い方が書いてあるので見てみると良いと思います。
言語系
次は言葉を理解する系の AI サービスの紹介をします。これは結構使い勝手いいものがあるのでお勧めです。
質問応答
質問に対して回答を返してくれる API を簡単に作れます!使い方のイメージとしては質問文と回答文のペアをどんどん登録していって学習させると、質問文に対して回答を返してくれる API が作れるようなものです。
イメージとしてはこんな感じで問い合わせると回答をくれるような機能を提供するアプリの裏側として使えます。画像は英語ですが日本語でも利用可能です。
質問文は完全一致ではなく、ある程度よきにはからってくれます。1つの回答文に対して質問文は複数パターン入れたりできるので、それでチューニングを行い精度を上げていく形になります。
その他に質問文に「こんにちは」を入れて回答文に「こんにちは、私は〇〇です」のようなものを入れたりしておくと、なんとなく会話出来てる風な API に仕立てることもできます。使い方は無限大!!
主な利用用途は質疑応答チャットボットの裏側で動くナレッジベースといったものですが、使いようによっては他にも利用できると思います。
こちらもクイックスタートのドキュメントの流れにそって使い始めてみるのが良いと思います。
翻訳
翻訳機能を提供する API も作ることが出来ます。こちらがクイックスタートになります。
翻訳機能についてはイメージしやすいと思います。日本語テキストから英語のテキストにしたり逆に英語から日本語にしたり。とても簡単に利用できるので、何か海外の人向けのサービスや日本人が海外に行ったときのサービスに組み込んだりするのにお勧めです。
視覚系
次に画像を解析する視覚系のサービスを紹介します。
Computer Vision
こちらは画像を解析してくれる API になります。例えば画像を投げ込むと、これはどんな画像なのか?ということを JSON 形式で返してくれます。
その他に以下のように画像の、どの場所に何が含まれているかといった結果も返してくれます。
こちらもクイックスタートから始めるのが一番とっつきやすいと思います。
ただ、結果が英語なんじゃが…となると思いますが、言語のカテゴリーで紹介した翻訳の API を併せて使うことで日本語化が可能です。Computer Vision を使う場合には併せて使うと良いでしょう。
OCR (文字認識)
Computer Vision の一部になるのですが便利なので個別に紹介したいと思います。端的にいうと光学文字認識 (OCR) が出来ます。画像を渡すと書いてある文字が結果として返ってきます。これもアイデア次第では何かに使えると思います。OCRで文字を読んで翻訳 API にかけるだけでカメラで撮った英語の看板を日本語に翻訳してくれるようなアプリとかに使えると思います。
クイックスタートのドキュメントはこちらになります。
Custom Vision
自分で画像をトレーニングさせて、例えば猫と犬を認識するような Web API を作ることが出来ます。トレーニング用の画像を自分で準備してラベル付けを行う必要がありますが、画像を見て判断するようなアプリの裏方として使いやすいと思います。
製品紹介ページはこちらになります。
ドキュメントのトップページはこちらになります。
ドキュメントの中のクイックスタートを見ると使い方がわかりやすいと思います。こちらがトレーニングの方法です。
トレーニングした結果を実際にアプリから使う方法はこちらになります。
Bing Image Search
Bing 系の API も色々あるのですが、個人的に一押しなものを紹介したいと思います。名前のとおりテキストから画像を検索してくれる API です。
説明ページとドキュメントが英語しかないというのがハードルが高いのですが…この API を使うと画像検索が使えるようになります。私は以前この API と OCR の API を組み合わせて英語のレストランのメニューの写真をとって、レストランのメニューの料理名の画像を返すといったようなアプリを作ってみました。地味に便利。
作ったアプリをデプロイしたい
ここまでは簡単に使える Web API として使えるサービスを紹介してきました。ハッカソンでは API を使うだけではなく自分たちで作った Web アプリケーションや Web API をデプロイして動かす必要があると思います。その時に使えるサービスを紹介したいと思います。
Azure App Service
このサービスを使うと .NET, Node.js, Java, Python, PHP で作られたアプリケーションを非常に簡単にデプロイして動かすことが出来ます。
こちらのサービスも各言語ごとにデプロイをするクイックスタートがあるので自分の使う言語にあわせて確認してみてください。
自分の推し言語が対応していない…という場合には Docker イメージにしてしまえば Docker もサポートしているので動かすことが出来ます。こちらは英語ドキュメントしかないのですが、クイックスタートページがあります。
Kubernates を立てたりするのはハッカソン的には若干オーバーキルな気がするのでサクッと作ってサクッと動かすのには Azure だと Azure App Service が一番手っ取り早いと思います。
DB が欲しい…
DB 系サービスもありますが DB 系は割とお金がかかるので価格表と自分の持っている料金枠との相談で作るといいと思います…
MysQL, PostgreSQL, SQL Database (SQL Server) あたりの RDBMS が作れますが、一番安上がりなのは SQL Database のサーバーレスプラン(使ってないと落ちる)を選んで、データ量やマシンスペックもケチったものになると思います。
使い慣れてない DB だとシンドイかもしれませんが、もし RDBMS をサクッと作りたいのであれば、個人的にはそれがお勧めです。
ローコード・ノーコード系
Microsoft のノーコード・ローコード系のサービスの Power Platform も Power Apps でサクッと画面作ったり Power Automate でフローを組んだりetc...と色々できます。
会社のほうで触ったりしてるような人も最近はちらほら増えてきてるのではないかと思います。
なのでハッカソンでも使えたりすると便利なのになぁ…と考える方もいらっしゃると思います。
そうはいっても Microsoft 365 テナントとライセンスが必要なのでハードルが高いそう!と思われるかもしれませんが、一応無料で短期間使える開発用の環境を整えることが出来るようになってます。
こちらのサイトにテナントの作成からライセンスの付与までまとまっています。
Power Platform 系の使い方は Microsoft Learn に色々なコンテンツがあるので、そちらを見ていただくのがわかりやすいと思います。Power Apps の初級のコンテンツのみに絞り込んだ検索結果に以下のリンクからアクセスできるので参考にしてください。
まとめ
以上、簡単にですが便利に使えそうな API と自分たちが作ったアプリを動かすために使えるサービスを紹介しました。ハッカソンはスピードが命なので普段使いのサービスがあるのであれば、そちらでやるのもいいと思いますが Azure には無料枠もあったりするので気になってる方はぜひ使ってみてください。