Chromeは最新バージョンのChrome Dev(バージョン127.0.6512.0以上)にAI機能が統合されており、実験的フラグの形で提供されています。
最新のChrome Devをダウンロード:https://www.google.com/intl/en_us/chrome/dev/
Chrome Devの設定
1、Chrome Devのバージョンが127.0.6512.0より高いことを確認します。
2、URLにchrome://flags/#optimization-guide-on-device-model
を入力し、Enabled BypassPerfRequirement
を選択します。これにより、モデルのダウンロードがスムーズに行えます。
3、URLにchrome://flags/#prompt-api-for-gemini-nano
を入力し、Enabled
を選択します。
4、モデルのダウンロードが完了するのを待ちます。ダウンロードが完了したかどうかは chrome://components/
で確認できます。主動的にダウンロードしない場合は、Check for update
をクリックして強制的にダウンロードできます。約1GBの内容をダウンロードする必要があります。Version: 2024.65.2205 を見ると、すでに使用できることがわかります。 Chrome Devを再起動します。
API 能力テスト
cmd + option + I
を押してコマンドラインを開き、await window.ai.canCreateTextSession();
を入力します。readily が表示されたら、使用可能です。
呼び出しケース1:テキストのトーンの書き換え
私たちは見ることができます、たった二行のコードだけで多くの人々が抱えるテキスト表現の問題を解決でき、非常に高速で非常に優れたプライバシー性を持って完成します。
呼び出しケース2:テキスト翻訳
極めて迅速かつ無料の方法でテキストの翻訳を完了し、任意のアプリケーションの多言語表示をより便利にします。
アプリ内統合
私たちのアプリ https://timmerse.com は、仕事や娱楽に適したカスタマイズ可能な3D没入型の世界です。人と人との間の没入型の接続を実現するためのスペースを作成します。ビデオ通話とカスタマイズされた3D世界を組み合わせ、AI NPCを統合して、仕事や生活の中の集まりをより創造的で楽しいものにします。
OpenDayのシーンでビデオを再生するとき、ユーザーのChromeの言語設定に基づいて、オリジナルの英語字幕をリアルタイムで翻訳し、二言語字幕として表示することが容易にできます。
もちろん、llmモデルは翻訳にだけ使えるわけではありません。各種エンドモデルとマルチモーダルが広く普及するにつれて、人々とデバイスの相互作用の方法を各方面で変え、生活と仕事の効率を向上させることが確実になります。