最新AIや開発ツールが登場、de:code 2019レポート(1)
日本マイクロソフトの開発者向けイベント「de:code 2019」が今年も5月29日、5月30日の2日間に渡って開催されました。
de:codeでは米国で開かれた「Build 2019」の内容を凝縮し、日本の開発者向けに読み解いてくれるのが見どころです。本記事ではAIやクラウド、開発環境についてのマイクロソフトの最新の取り組みをレポートします。
・平野社長がプロのように踊る? マイクロソフトのAIが社会を変革
・Linuxも取り込み、「Windows Box」を最高の開発環境に
・VSCodeやGitHubへの支持を背景に、Azureを推進
・マイクロソフトリサーチが進める自然言語処理の最前線とは
・まとめ
目次
平野社長がプロのように踊る? マイクロソフトのAIが社会を変革
de:code 2019の初日、基調講演に登壇した日本マイクロソフトの平野拓也社長は、奈良の「阿修羅像」の年齢推定や、パリの「ノートルダム大聖堂」の修復の例を挙げ、マイクロソフトのAIが実際の社会にどのように貢献しているか、実例を挙げて話しました。
奈良大学では、仏像の表情分析にマイクロソフトの学習染みAI「Cognitive Services」を活用。全国の210体の仏像の表情を「Face API」を用いて数値化し、興福寺の阿修羅像の年齢は推定23歳であることや、時代によって「喜び」や「怒り」の表情が変遷している傾向を明らかにしています。
パリで火災に見舞われたノートルダム大聖堂の事例では、文化遺産のデジタル化などを手がけるフランスのIconemと共同で「オープン・ノートルダム・イニシアティブ」を発表。過去の写真などから生成した3DデータをGitHubに公開することで修復に貢献するプロジェクトとしています。
その中心的なプラットフォームとして、マイクロソフトは「Microsoft Azure」「Dynamics 365」「Microsoft 365」、そして「Microsoft Gaming」を挙げています。
ゲーミング分野では5月17日に発表したソニーとの戦略的提携に触れ、ゲームのストリーミングやインテリジェントセンサーの共同開発といった方向性を示しました。グーグルが「Stadia」でストリーミング化を打ち出す中、マイクロソフトとソニーがどう対抗してくるのか注目の分野といえます。
AIを活用した自動運転の分野では、スタートアップ企業のアセントロボティクスとの協業を発表。神経科学や確率モデルを採り入れた「経験から学び取る」アルゴリズムを特徴としており、今後はAzureを活用して開発を進めていくとしています。
基調講演の合間には、平野社長がプロのダンサーのように踊る動画が紹介されました。これはプロのダンサーの動きからAIが振り付けのスケルトンを生成し、事前に収録した平野社長の動画をもとに生成したものだそうです。
Linuxも取り込み、「Windows Box」を最高の開発環境に
次に、2018年からOfficeとWindows製品の担当になった米マイクロソフトのジャレッド・スパタロウ氏が登壇。「ITの導入で本当に生産性は上がっているのか。ランニングマシンの速度が上がっただけではないか」と疑問を投げかけます。
iPhoneやAndroid端末が普及した現状を踏まえ、「世界中の人々がコンピューティングパワーを持ち歩くいま、アプリやデバイスよりも人間を中心に考えるべきだ」と指摘。Microsoft 365では、iPhoneを使ってどこからでも会議に参加し、仕事の続きができることを示しました。
Officeアプリ向けの新機能としては、Buildで発表した「Fluid Framework」を紹介。複数ユーザーで高速に共同作業ができるようになり、日本語から英語に翻訳しつつ、海外拠点で動作するWordアプリとリアルタイムにコラボレーションできることを示しました。
Edgeのレンダリングエンジンには「Chromium」を採用したことに触れ、今後のコントリビュートを約束しました。企業向けにはBuildで発表した「Internet Explorer mode」により、Edge上でIEとの互換性を確保していく方向性を示しました。
こうした変化に開発環境も対応していきます。新しい「React Native for Windows」では、JavaScriptを用いてレスポンスの良いWindowsアプリを書けるといいます。ステージではUWPにインポートしてもJavaScript側のソースコードは変わっていないことを示しました。
Buildでも大きな注目を浴びた「Windows Terminal」は、Windowsのコマンドプロンプトに加えてPowerShellやLinuxのシェルを統合しており、Unicode対応、合字や絵文字のサポートにより、日本語環境にもしっかり対応していることをアピールしました。
WindowsからデュアルブートなしでLinuxを利用できる「Windows Subsystem for Linux 2(WSL2)」では、JavaScriptを用いたWeb開発においてバックエンドからフロントエンドまでエンドツーエンドの開発環境が実現できることを示しました。
Linuxが動くPCには「Linux Box」の愛称がありますが、スパタロウ氏はそれを引いて「Windows Boxを最高の開発環境にしていきたい」といいます。Web開発でMacやLinuxを利用する開発者に、Windowsにも目を向けてもらいたいというマイクロソフトのメッセージが伝わってきます。
VSCodeやGitHubへの支持を背景に、Azureを推進
続いて、Azureを担当する米マイクロソフトのジュリア・ホワイト氏が登壇。Visual Studio 2019を用いたクラウド開発の最新情報を紹介しました。
ここでも最初に取り上げたのは、MacやLinuxにも対応した「Visual Studio Code」です。Stack Overflowの調査では50%以上の開発者が利用。Windows用のVisual Studio 2019を含め、「すべての開発者に対応できる」とホワイト氏は強調します。BuildではWebブラウザーで使える「Visual Studio Online」のプレビューも発表されました。
Azure DevOpsでは、Azure Kubernetes Serviceのパイプライン統合や、AWSなどマルチクラウドの接続にも対応。Visual Studio 2019を利用したデモでは、GitHubへのプルリクエストをトリガーに自動テストを走らせ、Kubernetes環境にデプロイできることを実演しました。
Gitのリポジトリへの操作をトリガーにCI/CD(継続的インテグレーション・継続的デリバリー)を回していく仕組みは、アマゾンやグーグルのプラットフォームにも存在するものの、Azureに最適化した仕組みとして進化している印象です。
開発者に人気の高いGitHubの存在も追い風になっています。2018年10月にはマイクロソフトによる買収が完了。新機能としてAzure Active Directoryとの同期や、GitHubアカウントによるAzureへのサインイン、GitHub Enterpriseとの統合サブスクリプションなど、両者の連携は着実に進んでいます。
マイクロソフトリサーチが進める自然言語処理の最前線とは
Azureが提供するサービスの中でも、AIを活用した「Azure Cognitive Services」では、音声からのテキスト書き起こしや帳票画像の自動解析など、ビジネスの現場にすぐに導入できそうな機能が提供されています。
そのAI技術を支えるのが、マイクロソフトリサーチによる研究開発です。de:code 2019では、米国以外で最大の研究所というMicrosoft Research Asia(MSRA)によるセッションが開かれました。Ming Zhou氏はその役割を「マイクロソフトの未来を確保するような仕事」と表現します。
MSRAによるここ数年間の成果として、152層のニューラルネットワークを用いて画像認識率96%を達成した「ResNet」、ニュース記事の人間と同等のレベルに達した機械翻訳技術、エラーレートが半減したOCR技術などを紹介しました。
特に目覚ましい進化を遂げているのが自然言語処理(NLP)です。MSRAが開発した自然言語処理のエンジンは、マイクロソフトの翻訳アプリ「Microsoft Translator」や、日本語のチャットボットサービス「りんな」、IMEや手話によるコミュニケーションに活用されているとのこと。
スポーツの試合からニュース記事を生成する例では、構造化データと非構造化データから試合中に何が起こったのかを時系列で分析。ニュースの文章を生成するだけでなく、映像からハイライトとなる写真を抽出することで、人間と同じレベルの記事を生成できるといいます。
動画の上をコメントが流れる「バレット・スクリーン」にも、AIが参加するようになります。動画を解析しながらコメントを考え、人間によるコメントと合わせて画面に流すことで、話を盛り上げます。この応用で写真や動画にキャプションを付けることも可能になり、チャットボットの機能として活用できるそうです。
チャットボットは単に意味を理解するだけでなく、感情を持たせることもできるとのこと。たとえば「明日晴れるかな?」という質問に対して、生産性重視のAIアシスタントは天気予報の結果を返すのに対し、共感重視のAIでは「どこか出かけるの?」と聞き返すなど、より親近感を覚えるような答えを返せるようになるわけです。
今後の自然言語処理は、事前学習などの分野で大きな改善の余地があるとのこと。MSRAの最新の取り組みとして2018年に登場した「BERT」や、2019年は「UNILM」などの言語モデルを挙げ、「人々の生活を飛躍的に改善していくために、まだまだできることはたくさんある」との見方を示しました。
まとめ
セッションの動画や資料については、de:code 2019のページで公開されています。各セッションに興味がある方はぜひこちらをご覧ください。
※セッション資料ダウンロードや動画の閲覧にはサインインが必要です。動画は順次公開されます。