0.Intro
一部ではCometはPerplexityのMAXプランでしか使えないという情報も流れています。しかし僕はPerplexityのプランはProなのですが、Cometが発表されてすぐにwaitlistに登録したので順番が上位だったからでしょうか、このようなメールが届いて使えるようになりました。
折角ですので使用感をレポートしたいと思います。
1.Overview
非常にシンプルな外観です。サイトやデスクトップアプリと同じような基調の色合いです。
初版のバージョンは以下のようです。
Alt + Aで開いて肝心のAssistantはこんな感じです。
こちらに指示を打ち込んでいきます。Assistant基本的にそのサイトについての指示となるようです。タブを切り替えると追随してくれます。
2.Assistant(文字入力)
肝心のアシスタンスです。日本語にて色々依頼してみました。
僕が試したのはだいたい
- Xを開く
- Xへの投稿
- Xのアカウント切り替え
- メルカリの商品検索
- Yahooショッピングでの商品検索
- (Cometの)タブの切り替え
- (Cometの)タブを閉じる
です。
上記、基本的に全部行ってくれました。ページを開くことは当然ながら問題ない。検索や投稿など入力が必要な作業もサイトのテキストボックスを探してきちんと行ってくれるなどはさすがAIブラウザだなと思いました。
ただアカウント切り替えや、商品検索など少し複雑な作業を依頼したときはAssistant上でReasoningによる検索を行い、操作方法が判明してから実行するという手順を踏みます。人間がやり方調べてから実行するのと同じですね。
こうなるとやはり時間がかかります。ユーザー的にはどうしても自分でクリックした方が早い、となります。ただ今回は単純な操作だからでそう思うのであって、込み入った複雑なタスクを投げた場合は、ユーザーは放置するだけとなるので、そのような所謂本格的なAIエージェントとして使い方をした場合は真価を発揮してくれるかもしれないですね。
一晩だけの検証ですが、想定以上に色々なことをやってくれると感じました。ポテンシャルは高いと思います。
気になった点としては
- 連続入力すると時々Enterで指示が飛ばず、マウスでクリックしないといけなかったり。(大した話ではないので、これからの調整に期待です)
- 連続して指示を出すと時々混乱します。ですのでAssistant上のスレッドを新規にしてこれまでの話をリセットする必要があります。この辺は今の生成AIの限界ですので、お気持ちをある程度察して付き合ってあげる必要があります。
- 検索を依頼したときサイト上で検索して欲しいところをAssistantのペイン上で表示されるということがありました。この辺は指示の出し方を改めるか、または会話のリセットか、など適宜対応が必要です。
3.Assistant(音声入力)
僕は決して活舌が良い方ではないですが、それでもかなり聞き取って操作してくれました。依頼してから動くまでのレスポンスは早いです。こちらは文字入力では思考の様子が画面表示されますが、音声場合は出ないので挙動を変えていると思われます。ただ…
- レスポンスのためにReasoningを最小限にしているからかXのアカウントの切り替えなど複雑な作業は断られる。
- タブの切り替えや閉じるなどを依頼した際、回答としては「完了しました」なのですが、実際は出来てないことが多々あった。
- サイトの操作についても思考を犠牲にしてレスポンスをとっているからか出来ないことが多い。その時は操作方法を説明してくれて手動でクリックすることを促される。
このような形ですので、あくまで個人的な感想ですが、音声だと「話が通じない人」となってしまい、大変ストレスを感じイライラしてしまいました。ですので、僕的にはあまり使わないかなぁとなりました。
4.その他
Chromeベースですのでショートカットキーもほぼ使える形です。ざっと色々見てみましたがブラウザそのものの機能としては今どきからして必要最小限のように思いますが、必要十分です。
個人的にAIブラウザは初めてでしたがここまで出来るのだなぁと驚きました。業務利用を想定した際、RPAなどよりも遥かにいい仕事してくれると思います。
もう少し色々使い込んでみたいと思います。
ちなみに、Default Browserに設定しました。