4
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Anthropic Computer Use のクイックスタートを試してみる

Posted at

はじめに

2024年10月23日に Computer Use という機能が発表されたのでちょっと試してみました。

Computer Use とは?

Claude can now use computers. The latest version of Claude 3.5 Sonnet can, when run through the appropriate software setup, follow a user’s commands to move a cursor around their computer’s screen, click on relevant locations, and input information via a virtual keyboard, emulating the way people interact with their own computer.

最新バージョンの Claude 3.5 Sonnet は、適切なソフトウェア セットアップを実行すると、ユーザーのコマンドに従ってコンピューターの画面上でカーソルを移動したり、関連する場所をクリックしたり、仮想キーボードで情報を入力したりすることができ、ユーザーが自分のコンピューターを操作する方法をエミュレートします。

つまり、 Claude 3.5 Sonnet で新たに実装された機能で、プロンプトを入力するとその指示に従って Claude がコンピューターを操作してくれる機能みたいです。

前提

今回行う実行する PC 環境は Mac です。
また、以下については事前に対応済みの状態で実施します。

  • docker インストール
  • Anthropic API Key の取得
  • クレジットのチャージ

事前準備

Computer Use を試すにあたり Anthropic 社が用意しているクイックスタートを利用します。

docker の起動

準備は簡単でリポジトリをクローンして docker を起動するだけです。

gitクローン
% git clone https://github.com/anthropics/anthropic-quickstarts.git
Cloning into 'anthropic-quickstarts'...
remote: Enumerating objects: 389, done.
remote: Counting objects: 100% (387/387), done.
remote: Compressing objects: 100% (231/231), done.
remote: Total 389 (delta 169), reused 318 (delta 129), pack-reused 2 (from 1)
Receiving objects: 100% (389/389), 3.07 MiB | 1.69 MiB/s, done.
Resolving deltas: 100% (169/169), done.
ディレクトリ移動
% cd anthropic-quickstarts/computer-use-demo

docker を起動する際に %your_api_key% の部分は各自取得した API キーに置き換えて実行してください。

docker起動
export ANTHROPIC_API_KEY=%your_api_key%
docker run \
    -e ANTHROPIC_API_KEY=$ANTHROPIC_API_KEY \
    -v $HOME/.anthropic:/home/computeruse/.anthropic \
    -p 5900:5900 \
    -p 8501:8501 \
    -p 6080:6080 \
    -p 8080:8080 \
    -it ghcr.io/anthropics/anthropic-quickstarts:computer-use-demo-latest
Xvfb started successfully on display :1
Xvfb PID: 9
starting tint2 on display :1 ...
starting mutter
starting vnc
PORT=5900
starting noVNC
noVNC started successfully
✨ Computer Use Demo is ready!
➡️  Open http://localhost:8080 in your browser to begin

docker へアクセス

docker を起動させると ➡️ Open http://localhost:8080 in your browser to begin というレスポンスが返ってくるのでアクセスします。
今回の利用ブラウザは Chrome です。
それでは Computer Use を試していこうと思います。

試してみる

今回、ブラウザを起動して Amazon サイトの閲覧 と、 git コマンドのインストール を試してみました。

Amazon サイトの閲覧

アクセスすると以下のようなデスクトップの画面が表示されるので、左下にある Type a message to send to Claud to control the computer... と表示されているボックスにプロンプトを入力します。
スクリーンショット 2024-10-28 16.37.182.png

ここでは 「Amazonのページを開いてください。」 と入力してみます。

するとメッセージを受けた Claude からの返答があり操作を始めます。

ちなみに、赤い四角に人の顔マークのアイコン はこちらで入力した内容を 黄色の四角にロボットマークのアイコンClaude の返答内容になります。

スクリーンショット 2024-10-28 16.45.08.png

662f464686fefa067b3176011fb98cdde8417e7cf1c4a30c451e908b.jpg

スクリーンショット 2024-10-28 16.45.39.png

41a03ac1bf67dabb0f53a167a996285ccb91ebe64713928ddea1c565.jpg

b10b3f23bd7f68c6af6e7541513b240c2c0dd2eba14842907bd3ee87.jpg

スクリーンショット 2024-10-28 16.46.06.png

750e7e7679785039df1f165cce6927aeb01157776989ee71cf7b7826.jpg

2f72bbe97eb240ed4ee624cb36531415dfe65612eb1464c2bb816c70.jpg

07f4b4908a1eb9713531a378b506684ea27c0fc5bf4dc6113fcbe025.jpg

f01b856946a149eeef559ed4ff30edadc82c4087fbb04cbe9cd34431.jpg

スクリーンショット 2024-10-29 9.37.52.png

Claude がステップごとに説明しながら操作してくれました。

今度は開いたブラウザを閉じてもらいます。

スクリーンショット 2024-10-29 9.39.13.png

f01b856946a149eeef559ed4ff30edadc82c4087fbb04cbe9cd34431.jpg

スクリーンショット 2024-10-28 16.48.34.png

ddaead268467b9135f0399f5a9d9b7ff53ff8441dd83cf4f33dfe1ea.jpg

スクリーンショット 2024-10-28 16.48.48.png

無事にブラウザが閉じられたことを確認できました。

git コマンドのインストール

今度は git コマンドのインストールをお願いしてみます。

スクリーンショット 2024-10-29 9.56.14.png

スクリーンショット 2024-10-29 9.58.02.png

キャプチャだと右端が途切れてしまうためログを一応記載しておきます。

gitインストール
Hit:1 http://ports.ubuntu.com/ubuntu-ports jammy InRelease
Get:2 http://ports.ubuntu.com/ubuntu-ports jammy-updates InRelease [128 kB]
Hit:3 https://ppa.launchpadcontent.net/mozillateam/ppa/ubuntu jammy InRelease
Get:4 http://ports.ubuntu.com/ubuntu-ports jammy-backports InRelease [127 kB]
Get:5 http://ports.ubuntu.com/ubuntu-ports jammy-security InRelease [129 kB]
Get:6 http://ports.ubuntu.com/ubuntu-ports jammy-updates/universe arm64 Packages [1396 kB]
Get:7 http://ports.ubuntu.com/ubuntu-ports jammy-updates/main arm64 Packages [2327 kB]
Get:8 http://ports.ubuntu.com/ubuntu-ports jammy-updates/restricted arm64 Packages [2563 kB]
Get:9 http://ports.ubuntu.com/ubuntu-ports jammy-updates/multiverse arm64 Packages [29.5 kB]
Get:10 http://ports.ubuntu.com/ubuntu-ports jammy-security/restricted arm64 Packages [2491 kB]
Get:11 http://ports.ubuntu.com/ubuntu-ports jammy-security/universe arm64 Packages [1113 kB]
Get:12 http://ports.ubuntu.com/ubuntu-ports jammy-security/main arm64 Packages [2057 kB]
Fetched 12.4 MB in 6s (2213 kB/s)
Reading package lists...
Building dependency tree...
Reading state information...
All packages are up to date.
Reading package lists...
Building dependency tree...
Reading state information...
git is already the newest version (1:2.34.1-1ubuntu1.11).
0 upgraded, 0 newly installed, 0 to remove and 0 not upgraded.

また、

WARNING: apt does not have a stable CLI interface. Use with caution in scripts.

WARNING: apt does not have a stable CLI interface. Use with caution in scripts.

という警告も出ていますが、これは apt コマンドに対するエラーで apt コマンドのCLIインターフェイスは安定していないので、スクリプト内で使用する場合は注意してください。 という内容になります。
apt をスクリプト内で使用したり、docker コンテナ内で利用すると発生する場合があるそうです。

スクリーンショット 2024-10-29 9.57.41.png

インストールがちゃんとされているかまで確認してくれました。

おわりに

プロンプトを入力するだけで操作してくれるのはとても便利です。
この機能によってこれから色んな可能性が広がって行きそうな感じがしました。

参考

4
2
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
2

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?