0
0

アプリケーションにほぼリアルタイムの無料多言語翻訳を統合し、Chrome AI APIに基づいています

Last updated at Posted at 2024-06-11

Chromeは最新バージョンのChrome Dev(バージョン127.0.6512.0以上)にAI機能が統合されており、実験的フラグの形で提供されています。

最新のChrome Devをダウンロード:https://www.google.com/intl/en_us/chrome/dev/

Chrome Devの設定

1、Chrome Devのバージョンが127.0.6512.0より高いことを確認します。

2、URLにchrome://flags/#optimization-guide-on-device-modelを入力し、Enabled BypassPerfRequirementを選択します。これにより、モデルのダウンロードがスムーズに行えます。

3、URLにchrome://flags/#prompt-api-for-gemini-nanoを入力し、Enabledを選択します。

4、モデルのダウンロードが完了するのを待ちます。ダウンロードが完了したかどうかは chrome://components/ で確認できます。主動的にダウンロードしない場合は、Check for update をクリックして強制的にダウンロードできます。約1GBの内容をダウンロードする必要があります。Version: 2024.65.2205 を見ると、すでに使用できることがわかります。 Chrome Devを再起動します。

image.png

API 能力テスト

cmd + option + I を押してコマンドラインを開き、await window.ai.canCreateTextSession(); を入力します。readily が表示されたら、使用可能です。

image.png

呼び出しケース1:テキストのトーンの書き換え

image.png

私たちは見ることができます、たった二行のコードだけで多くの人々が抱えるテキスト表現の問題を解決でき、非常に高速で非常に優れたプライバシー性を持って完成します。

呼び出しケース2:テキスト翻訳

極めて迅速かつ無料の方法でテキストの翻訳を完了し、任意のアプリケーションの多言語表示をより便利にします。

image.png

アプリ内統合

私たちのアプリ https://timmerse.com は、仕事や娱楽に適したカスタマイズ可能な3D没入型の世界です。人と人との間の没入型の接続を実現するためのスペースを作成します。ビデオ通話とカスタマイズされた3D世界を組み合わせ、AI NPCを統合して、仕事や生活の中の集まりをより創造的で楽しいものにします。

OpenDayのシーンでビデオを再生するとき、ユーザーのChromeの言語設定に基づいて、オリジナルの英語字幕をリアルタイムで翻訳し、二言語字幕として表示することが容易にできます。

image.png

もちろん、llmモデルは翻訳にだけ使えるわけではありません。各種エンドモデルとマルチモーダルが広く普及するにつれて、人々とデバイスの相互作用の方法を各方面で変え、生活と仕事の効率を向上させることが確実になります。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0