はじめに
どうも、趣味でデータ分析をしている猫背なエンジニアです。
私ごとですが、本日入籍しました。入籍はしましたが、技術探求は引き続きやります。
今回は、記事投稿キャンペーンで「「Vibe Coding」で創る、インストール不要の生成AI「Skywork」での開発体験を投稿しよう!」を投稿するイベントが開催されてたので、引き続き参加しました。
今回は、約2週間skyworkを使用してみたので、記録していきます。
Skywork?
skyworkについては2つの記事を書いたときに紹介したので、省略します。以下2つで個人的に面白い結果が得られたので、拝見してみてください(笑)
■ Skyworkという汎用AIをGPTと対決させてみた。 - 賃貸探しリターンズ
■ 🎤Skyworkでポットキャスト作れんじゃん。なにこれ。おもろ。
2週間使用してみて思ったこと。
約2週間で汎用モード、ポッドキャストモード、AIデベロッパーモードを体験しました。
■ 汎用モード
skyworkの中で、まず汎用モードというものがあります。使い方としてはchatgptみたく質問をすると答えが返ってくるというロジックで相違ないと思います。
ちなみに、これに関しては、先ほど紹介したskyworkという汎用AIをGPTと対決させてみた。で使用しており、使用感としてみては、GPTよりは優秀かなと思いました。
■ ポッドキャストモード
ポッドキャストモードに関しては、私も驚きだったのですが、セリフを生成するだけではなく音声もつけてくれるという点で驚きました。
この要素に関しては今後も何かのご縁があったら使用し続けたいと思いました。
■ AIデベロッパー
最後にこちらに関してですが、ぶっちゃけとても残念でした。
理由としては、Pythonコーディングが非対応なところです。発展途上のアプリケーションという面もあるのですが、私としてはPythonメインでコーディングしていたので、対応されていないのはとても残念です。
〇要求:画像を認識するAIをPythonで作ってください。
ご質問を受け付けました。Skyworkが情報を整理し、正確かつ包括的な回答をご提供いたします。
画像認識AIをPythonで作成するプロジェクトを開始します。まず、プロジェクトをセットアップして、要件を確認させていただきます。
<生成文 省略>
外部APIなしでブラウザ内で動作する画像認識AIを作成します。
TensorFlow.jsの事前訓練済みモデルを使用します。
<生成文 省略>
AI画像認識システムが完成しました!🎉
主な機能:
TensorFlow.jsとMobileNetを使用したブラウザ内画像認識
JPG、JPEG、PNG形式の画像に対応
リアルタイムでの物体検出と分類
信頼度付きの認識結果表示
外部APIやバックエンド不要
アクセスURL: XXXXXXXXXXXXXXXXX
画像をアップロードすると、AIが自動的に物体を認識して結果を表示します。完全にブラウザ内で動作するため、プライバシーも保護されます。
こんな感じで、ソースコードを提示してほしいと要求してもあいまいにされる...(笑)
調査を進めるに、どうやらReactはばりばり好んでるみたいで、めっちゃ提示してくる。Webアプリを作る人は超絶向いているAIなのかもしれない。
結論...私は今後もChat GPT。
■ おまけ(SkyworkR1V1をローカルで構築)
ちなみに、Skywork-R1V1をGitからダウンロードしてローカルで構築できると紹介したので、実際にローカル構築を目指しました。
結論から言うと、構築できなかった。
んで、やっぱりアクセストークンがいるみたい。
GPUを回す前までは構築でき、なんとかアクセストークンが不要な方法で、ローカルのみで回せるように構築したのだが、Pytorchが私のCUDAバージョンに対応していないとかで、回せなかった...。(ほかの数字生成AIで使用しているためアップデートしたくない)
CPUで回す方法を模索したが同様で回せず。何かわかったらまた挑戦します。
おわりに
いろいろ使わせてもらったが、結論としてはSkyworkはデベロッパー向きというよりユーザ向きのツールということがわかりました。
今後は前提調査などの際に使わせてもらいます。
参考文献