はじめに
どうも、趣味でデータ分析をしている猫背なエンジニアです。
初コロナを抜け、やっとPCに向かって弱パワーを発揮できるまでに回復しました。
今回は、記事投稿キャンペーンでSkyworkという生成AIでの開発体験を投稿するイベントが開催されてたので、参加しました。
最近はいろいろなAIが出てきてどれがいいのかさっぱりわかりません...(笑)
基本的にはGPTを使っているのですが、実際にskyworkというAIを実際に触ってみてどんなことができるか調べてみたいと思います。
Skywork?
■ 概要
Skyworkは、マルチモーダル/オフィス業務特化型 AI ワークスペース(AI エージェントプラットフォーム) をめざすサービス/技術群。
“Skywork R1V: Pioneering Multimodal Reasoning with Chain-of-Thought” という論文があり、テキストと視覚モーダルの推論を統合する手法を提案。
また、その後継モデル(R1V2)や、報酬モデル(VL Reward)との関連研究も出ており、多モーダル理解と推論に関する技術的進展が見られる。
■ 特徴・強み
〇マルチ出力
文書、スライド、表計算、ウェブページ、ポッドキャストなど、様々な形式のコンテンツを一つの指示で生成できる機能を提供。
〇垂直特化型エージェント構成
汎用型に全てを担わせるのではなく、「ドキュメント専用」「スライド専用」など形式別の専門エージェント群で構成されているという設計。
〇出展・信頼性重視
生成結果における情報源(出典)や引用を明示する機能を持つとされており、ビジネス利用を意識した信頼性担保が特徴。
〇ディープサーチ能力
単なる表面的な生成を超えて、リサーチ(調査)機能を強化し、深掘りできる情報生成。
〇技術基盤:Skywork-R1V
“Skywork-R1V” というマルチモーダル推論モデル(テキスト+画像理解/生成能力を融合)を中核モデルとして研究/開発しているという情報が公表。
〇公開モデル・研究
Skywork の GitHub リポジトリが存在し、研究者・開発者にもアクセスできるモデル要素を出している様子。
■ リソース・提供形態
2025年5月19日、AIオフィス効率化を目的とした「Skywork Super Agents」が日本および北米で同時リリースされたという発表があります。対応形式としては、文書(Documents)、スライド(Slides)、表計算(Sheets)、Webページ(Webpages)、ポッドキャスト(Podcasts)の 5 形式に特化したエージェントを持ち、それらと汎用型エージェントを組み合わせて提供する設計。また、開発者向けには MCP(Model Context Protocol)という枠組みがあるとの言及もある。
モデルはオープンソース/公開モデルの要素もあり、GitHub にリポジトリがあります。
(↑これディープシークに代わるAI出たってことね?)
■ デメリット?
以下は考えたデメリットではありますが生成AIあるあるだと思うので、流しでもいいと思います(笑)
〇データセキュリティ・プライバシー
入力データやアップロード資料をどう扱うかはユーザーとして気にすべき点です。特に機密性の高いビジネスデータをAIに投入する際には、処理ポリシーや保存・流出リスクを確認すべきという指摘があります
〇生成内容の正確性と「幻覚(hallucination)」
AIの特徴として、出典を示しても誤った生成や未検証の内容がまじる可能性が常にあります。信頼性チェックや人のレビューが不可欠です。
〇機能/表現の限界
「一つの指示で複数形式を同時に完結」というコンセプトは強力ですが、実際のアウトプット品質がどこまで担保されているか、特定状況では調整が必要である、という報告も見られます。
〇コスト・クレジット制度
サービス利用にはクレジット制度や有料プランがあり、どのくらいコストがかかるか、消費量の見積もりが重要になります。
本題のチャレンジについて🏠
■ 概要
「こんなコーディングなどを生成してくれた!」などはおそらく他のデベロッパーの方がしてくれると思うので、私は以前の投稿「GPTで賃貸探しをして、3LDK+駐車場で10万円以内の好物件を発掘した話。」をもとに比較検討していきたいと思います。
※以下の条件などは過去のものになります。ご了承ください。
■ 私のスペック(土地勘)
まずは土地勘を共有します。
〇 九州生まれ、九州育ち。
〇 『JR 鹿児島本線しか勝たん!』
〇 関東は2年在住。神奈川県がメインで、東京以外の県外に行かない。
〇 神奈川県は人いっぱいおりすぎて人酔いした。
〇 内心、「関東は路線いっぱいありすぎて、スパゲティと思っている」
〇 関東なんてどんな路線があるか知らん!
私は7月にこの方法で探していますが、実際に私が住んでいる賃貸/地域とは関係ありません。
また、最新の賃貸価格/治安情報によりGPTの条件提示なども変わってきますので、あくまで参考程度にご覧ください。
■ GPTでの場所探しプロセス
GPTでは以下の4つのプロセスで最終的にSUUMOを駆使して実施しました。同じぐらい工数で見つけてくれるのか実際にやってみたいと思います。詳細に関しては概要中の投稿リンク先から閲覧してください。
Step1:品川駅から1本で行ける路線を調査
勤務先は品川駅。そのため「品川まで1時間以内・乗り換えなし」で行ける路線をGPTに調べてもらいました。
Step2:山寄りの立地かつ10万円未満の条件をinput
海沿いエリアは地震・津波が気になるため除外。条件に合う「山寄の候補地」を提示してもらいました。
Step3:それぞれの路線の相場を調査
駅ごとではなく「路線全体の平均相場」を出してもらい、安い路線を重点的に調べました。
Step4:場所は決定!京浜東北線沿いの賃貸探し
いままで物件の相場や位置関係をGPTに吐き出してもらいました。場所に関しては路線まで絞り込むことができました。10万円前後も可能性があり、山寄りの路線ということで最終的に京浜東北線沿いの賃貸を探すようにしました。
以下からは京浜東北線沿いで治安がいい街を探してほしいということをInputしました。
■ いざ、実験!!
Step1:品川駅から1本で行ける路線を調査
勤務先は品川駅。そのため「品川まで1時間以内・乗り換えなし」で行ける路線を調べてもらいました。
品川まで1時間以内で、乗り換えなしにアクセスできる主な路線と駅は次の通りです。
### 主な路線と駅(品川まで約30分以内)
1. **JR山手線**
- 例:西日暮里駅(所要時間:約25分)
2. **JR横須賀線**
- 例:新川崎駅(所要時間:約14分)、戸塚駅(所要時間:約27分)
3. **JR京浜東北線**
- 例:鶴見駅(所要時間:約18分)
4. **京浜急行電鉄**
- 例:上大岡駅(所要時間:約26分)、平和島駅(最短12分)
5. **東海道新幹線(一部の駅)**
- 例:小田原駅(ひかり号で約27分)
### その他の情報
- 品川駅には複数の路線が乗り入れており、アクセスが非常に便利です。
- 家賃や生活の利便性を考慮して選ぶと、快適な生活が送れます。
詳しい情報が必要な場合は、各駅の周辺環境や交通手段をさらに調べてみるといいでしょう。
いい感じですね...と言いたいところですが、この対決に関してはSkyworkの圧勝です。
理由は、この画面を見てください。
そう、右側のバーチャルマシンなるものに賃貸相場が出ているではありませんか....。なんじゃこれ。どうやら要約したwebサイトであり、相場などの情報も書いてありました。
私は一切相場情報を与えていないのに...です。(笑)
■ 考察
相場が出るだけでも勝敗は決しているので、今回はSkyworkの勝利にしますが、これが出るに路線というワードに対して紐付けで賃貸などが出るロジックになっているのか、それともgoogleアカウントでログインをしたので、chatgptの何らからの情報をもとに出てきたものなかは不明。もしくは機能の一つである、ディープサーチ能力で人間の意図を深読みしたものなのか...。
何にしろ、汎用エージェントおそるべし...。
おわりに
個人的にはDeepSeekでオープンソースで使えるみたいなことが盛り上がっていたけど、中国だから怖いねって思ったディベロッパーもいたと思うので、日本産ではないですが、モデルが利用できるのはうれしいですね。
まあ、けど使い方とバックボーンが昔からわかっているgptを今後も私は使いますので、気が向いたらこちらも研究していけたらと思います。
以上。
参考文献
