Posted at

Open Source Summit North America 2019 Report 現地行ってないけど

現地に行ったわけではないのだが、3夜連続2時過ぎに目覚まし鳴らしてKeyNote聴くために起きたので、折角だから自らの理解定着のためにも記事を書く。目からウロコな技術動向に関する見解等をシェアはできないと思うが何かを知る/知りたくなるきっかけになれば幸い。


Open Source Summit

Linux Foundation(以下LF)主催のカンファレンス。毎年数回(北米、欧州)で開催される。LFといえばLinuxを始めとする現在稼働する様々なサービスを支える各OSSを、その傘下のプロジェクトとして活動を支えている。非営利組織です。その数は今や数え切れないほどに上る(直下にこちらのプロジェクトがあり、さらに各配下に更に多くのOSSプロジェクトが存在していたりする。例えばKubernetesやPrometheusを含むCNCFのプロジェクト一枚絵を見るとCloud Nativeの流行り具合が如実に伝わってくる。


セッション

セッション一覧はこちらから確認できる。イベント修了から時間も立っているのでスライドをシェアしてくれているセッションが多く見られる。通例だと更にもう少しすればセッションの動画もYouTubeにアップされるはずなので興味のある方は要チェックである。公開されているセッションタイトルを抽出してWord Cloud化すると以下のようになる。

Word Art.png

意外にも'IoT'の頻度が高い。これを踏まえてセッションをタイトルを見直すと確かに「セキュア」やデータに関連するキーワードとセットになって「IoT」が使われていることに気づく。後述するが次の流れであると基調講演内で語られていた「オープンデータ」の流れとも合致しなくもない。


スポンサー

こちらでも「オープンデータ」の流れを表すかのようにDBや分散ストレージなどのベンダーも目に着くが気がする。が考え過ぎかもしれない。スポンサー一覧


Cloud Nativeの次はオープンデータだ

基調講演内で2つの大きなアナウンスがありました。Confidential Computing Consortium(CCC)の設立、とOpenPowerがLinux Foudationのエコシステム内に取り込まれた、この2つです。


Confidential Computing Consortium(CCC)

Confidential Computingとは、AI等の分析に「利用中」のデータ(やロジック)を、分析の本来の目的を阻害することなく秘匿化することを指します(うまく表現できているか自信ナイ)。現状のクラウド等で見られるソリューションは、秘匿データの「保存時」や「転送時」を暗号化等によりケアしたものは多く存在しますが、Confidentialなデータをまさに何らかの計算で利用している最中の秘匿性のケアに関しては、これといった枠組みがないのが実情のようです。これをLinux Foudation内の多様性のあるクロスボーダーなエコシステムの中でハードウェア/ソフトウェアの両面から強調し合って枠組み作りをするのが、このCCCの役割のようです。ARMやIntel等の大手チップセットベンダーからAlibaba,Google,Microsoft等の主要クラウドベンダーが参画しています。

コンピュータ性能やインフラの高性能化に伴い、Confidentialなデータやロジックを利用する場所がローカルからクラウド、エッジ環境など多岐にわたるため、そのような環境下でも秘匿性を分かりやすく、かつ統一された枠組みの下で担保できるようにするニーズが急速に高まっていることも背景にある。

Confidential Computing Foundation

New Cross-Industry Effort to Advance Computational Trust and Security for Next-Generation Cloud and Edge Computing - The Linux Foundation


Linux FoundationへのOpenPowerの合流

IBMプロセッサのアーキテクチャをオープンにして、より自由度の高いチップセットの選択肢を業界内に与えることでムーアの法則の終焉に立ち向かおうとしている(Moore's Law graphed vs real CPUs & GPUs 1965 - 2019)。CPUで処理するにはもう無理のある計算量をGPU等の特定処理に特化したデバイスにオフロードしたりすることが欠かせないわけですが、このようなモノスゴイ計算量を取り扱うData-centricなチップセット作りとかをクラウドベンダでもできるようになるわけだ。

上記2つの出来事に共通していえることがデータを如何に上手く、素早く扱うか、というポイントであると思っていて、やはりCloud Nativeの次はオープンデータなんだな、って言われてみると、そうだなと思うわけです。ちなみにGoogleとIBM&RedHatが両方に組織に参画中。

The Linux Foundation Announces New Open Hardware Technologies and Collaboration - The Linux Foundation


Keynote

いくつか個人的に面白かった基調講演を紹介しておく。


Fueling Innovation Engines by Creating, Collecting, and Improving Stepping Stones

Uber AI Lab.の人の基調講演。地球上の種の進化のようにあえてモデル学習時に明確なゴールもろくに与えず様々な方向性に分岐(進化?)を促し、定義が曖昧な問題に対しても高性能なモデルを得るアプローチ、らしい。詳しいAI/MLまわりのことは詳しくないので後述のYouTubeに説明は譲るが、要はOSSのコミュニティもコレに似た形で成長を遂げていて、さまざまなプロジェクトが生まれ、それらを組み合わせ、またはヒントにして一部では自然淘汰もされながら更に新たなプロジェクトが生まれていく、という話でした。

ICML 2019 Tutorial: Recent Advances in Population-Based Search for Deep Neural Networks - YouTube

Screenshot_20190822-030617.png


Open Data @ Facebook

高解像度衛星写真から被災地等の最新かつ正確なOpenStreetMapデータをAIを使って生成&チェックするプラットフォームを実験している。The Tasking Managerというプラットフォームをアシストするような形で技術を提供しようとしている(まだテスト環境の公開のみ)。他にも災害時の被災状況をFacebookの利用状況を利用して可視化する研究についても紹介があった。ちょうどNetflixでGreat Hackというドキュメンタリー(SNSデータを使ってBREXITや大統領選をコントロールした話)を見たばかりだったので、人道支援の活動が印象的だった。

Home - Tasking Manager - Machine Learning Playground

Screenshot from 2019-09-04 23-27-14.png

OSM at Facebook - YouTube より

https://mapwith.ai


Calling All Doc Stars

Writer向けSummer of Codeのような感じ。

Contribution活動としてDocumentationも定着し始めてきており、Linux Foundationとしては次の段階としてUXデザイナーの参加を呼びかけていた。がWriterの割合としてはまだまだ少なくCoderが圧倒的に多い。一方でドキュメントの良し悪しが、OSS利用やContribution活動を促進させる重要なドライバーの1つでもある(DigitalOcean調べ)。GoogleがTechnical WriterをOSS projectで活動できるお膳立てをしてくれる。先行から各プロジェクトとのBondingなどかなりきめ細かなサポートがあるようだ(流れはこちら。ちょうど各プロジェクトでのDocumentation活動のフェーズが始まった模様)。



Season of Docs Now Accepting Technical Writer Applications | Google Open Source Blog より


おわりに

このサミットは北米だけではなく、ヨーロッパや日本でも毎年開催されています。世界のエンジニアから刺激がもらえそうですし、機会があればぜひ参加してみてはいかがでしょうか。私も是非行きたい。