これは何?
5月11日発刊の 図解速習DEEP LEARNINGの書籍中で参照しているリソースをサポートページ用にまとめたものです。
(実行できる.ipynbノートブックへのリンクなど、書籍自体のサポートページは https://github.com/tomo-makes/dl-in-a-sec です)
もともとは本を読みながら各リンクを眺めてもらうため、飛びやすくしようとリンクを整理しましたが、本が手元にない方にも役立つのではと思い、Qiitaで公開することにしました。
凡例
YouTubeなどのビデオ
論文、サーベイ資料
プレゼンスライド
書籍
GitHubリポジトリ
ニュース
メールニュース
- リンクは本の章立てに沿って並んでいます
さて、学会、勉強会、発表会などの1年にあるように、ゴールデンウィーク明けからイベントラッシュ。様々な発表が期待されます
- 5/6-9 ICLR 2019
- 5/6-8 Microsoft Build
- 5/7-9 Google I/O
1章 機械学習・深層学習を学ぶための地図を持とう
1.1 「知る・わかる」から「できる」へのロードマップ
機械学習・深層学習を学ぶみちすじ
Jupyter Lab/ Colaboratoryなどの対話型環境、それをPaaS/ SaaSとして提供するサービス、チュートリアルが増えてきたので、まず「習うより慣れる」で取り組んで見ると良い、という図。
「Why/What/How」 - 地図3: 適用分野と手法
- ビジネス適用の事例
- McKinseyのAI事例・考察レポート Notes from the AI frontier: Applications and value of deep learning
- アート適用の事例
「必要な道具と実装」 - 地図6: システム、アーキテクチャと権利
- AIをビジネスで扱う際知っておくべきこと 弁護士 柿沼太一氏『AI開発を円滑に進めるための契約・法務・知財』
1.2 さまざまな分野と最先端の事例
この節は、表形式・画像/映像・文章/言語・音声/音楽・その他の分野別、また認識・生成・行動といった種類別に追ってみる、事例のシャワーです。
各分野の広がりと最新状況を知る
- 膨大な数の実装付き論文のまとめサイト Browse the State-of-the-Art in Machine Learning
数値・表形式 - 推論: データから、対象を予測する
表(テーブル)形式のデータを対象とした機械学習の概要、現状紹介。
- Airbnb事例 【KDD2018】論文『Customized Regression Model for Airbnb Dynamic Pricing』を読んでまとめた - 港区で苦しむデータサイエンティストのメモ帳
- コンペ参加と、過去事例から「何ができるか」学ぶことのすすめ
画像/映像系 - 認識: AIの目にうつるもの
一般物体認識・特定物体認識の概要、現状紹介。
- ImageNet画像認識コンペでの深層学習の躍進 ImageNet Large Scale Visual Recognition Competition 2012 (ILSVRC2012)
- 物体検出の現状 YOLOv2 vs YOLOv3 vs Mask RCNN vs Deeplab Xception - YouTube
- 骨格検出を使った楽しいデモ AI Experiments: Move Mirror
- 骨格検出 DensePose
- 特定物体認識 Google Landmark Recognition Challenge | Kaggle
画像/映像系 - 生成: AIの描き出すもの
GANなどの深層生成モデルの紹介。各デモムービーをざっと見るだけでも面白いです。
- Progressive Growing of GANs for Improved Quality, Stability, and Variation - YouTube
- jirou interpolation video - YouTube
- One Minute Exploration in Crypko Space - YouTube
- アイドル自動生成AIを開発 | データグリッド
- BigGAN: A New State of the Art in Image Synthesis – SyncedReview – Medium
- シモセラ エドガー 敵対的データ拡張による自動線画化
- PaintsChainer -線画自動着色サービス-
- (自動彩色Colorful Image Colorization) ローマの休日トレーラー Roman Holiday Trailer (Zhang) - YouTube
- “少ないデータ”で高精度AIを実現したRidge-i--白黒映像をカラーに、ゴミ焼却炉は自動化 - CNET Japan
- Research at NVIDIA: Transforming Standard Video Into Slow Motion with AI - YouTube
- SRGAN Super-resolved video - YouTube
画像/映像系 - 認識と生成の間
深層生成モデルの持つ可能性、リスク、解釈性について。こちらも前半のビデオが興味深いです。後半に解釈性の説明があります。
- CycleGAN Face-off 直播換臉 - YouTube
- Here Come the Fake Videos, Too - The New York Times
- Deep Video Portraits - SIGGRAPH 2018 - YouTube
- FaceForensics: A Large-scale Video Dataset for Forgery Detection in Human Faces - YouTube
- NIPS 2017 Competition Track
- NIPS 2018 Competition Track
- NIPS’17 Adversarial Learning Competition に参戦しました | Preferred Research
- Activation Atlas
- tensorflow/lucid: A collection of infrastructure and tools for research in neural network interpretability.
文章/言語系 - 言葉を操るAI
代表的な対話ボットから、文章生成のデモまでを取り上げます。
- Google Translate
- りんな
- Studio OusiaのAIがクイズチャンピオン達と対戦し勝利 | Studio Ousia
- コンピュータが小説を書く日
- 1901.11504 Multi-Task Deep Neural Networks for Natural Language Understanding
- Better Language Models
and Their Implications
音声/音楽系 - AIが聴き・話し・演奏するもの
スマートスピーカに代表される音声認識・合成から、音楽の生成まで事例を取り上げます。
- Googleアシスタントが音声通話で予約を取ってくれる――マンハッタンのレストランでDuplexのデモに参加してきた | TechCrunch Japan
- A Neural Parametric Singing Synthesizer
- A Universal Music Translation Network - YouTube
- Magenta
- AI Experiments | Experiments with Google
- ISMIR 2018
- 20180925_A_ismir-2018-live-stream_IML4M+SessionC - YouTube
- ybayle/awesome-deep-learning-music: List of articles related to deep learning applied to music
- The Sound of Pixels
- Gierad Laput | Synthetic Sensors
グラフを扱う
数理的にグラフとして構造が表されるものはたくさんあります。グラフを扱った深層学習の現状について。
- 機は熟した!グラフ構造に対するDeep Learning、Graph Convolutionのご紹介 - ABEJA Arts Blog
- Graph Convolutionを自然言語処理に応用する Part1 – programming-soda – Medium
- 1812.08434 Graph Neural Networks: A Review of Methods and Applications
- 1901.00596 A Comprehensive Survey on Graph Neural Networks
その他の領域
ここまでの紹介に入らない、触覚、3次元モデルなどの深層学習事例について。
- 東大と日立の研究者、素材に触れた時の触振動を画像からそれっぽく生成し、効率的な触感デザインを可能とする手法「TactGAN」を発表 | Seamless
- timzhang642/3D-Machine-Learning: A resource repository for 3D machine learning
- Implicit 3D Orientation Learning for 6D Object Detection from RGB Images - YouTube
強化学習: 行動を学ぶAI
Atariゲーム、碁、最近では多人数プレイのリアルタイム戦略ゲームまで、強化学習の幅が広がりました。その事例について。
- Recurrent Experience Replay in Distributed Reinforcement Learning | OpenReview
- Google AI Blog: How Robots Can Acquire New Skills from Their Shared Experience
- https://outreach.didichuxing.com/tutorial/AAAI2019/static/DRL with Applications in Transp_AAAI19tutorial.pdf
- 横河電機とNAISTが化学プラント向けに強化学習、少ない試行回数で高度な制御を実現 | 日経 xTECH(クロステック)
1.3 最新の知見についていくために
自分の追いたい抽象度を意識しながら、上のトレンドに終わらせず、継続して最新情報を追いかけてみます。その際のリソース・考え方紹介です。
新しい情報を取り入れるには
フォローすべきメディア
日次、週次、四半期、年次と鮮度に応じてフォローすると良いメディアの紹介。特にWeekly Machine Learning, Rumors of MLのメールニュース2点はおすすめです。
- arXiv.org e-Print archive
- Machine Learning - Reddit
- Hacker News
- POSTD | プログラミングするエンジニアに向けたトレンドメディア
- Weekly Machine Learning - piqcy | Revue
- Rumors of ML | Revue
- xpaper.challenge
- Distill — Latest articles about machine learning
- OpenAI Blog
- News & Blog | DeepMind
- 私のブックマーク – 人工知能学会
- AHC-Lab M1勉強会 論文の読み方・書き方
学会、勉強会、発表会などの1年
歳時記。このGW明けから6月は、色々な発表が楽しみです。
機械学習系の学会
新製品発表・技術カンファレンス系
多様な講座と学びのアプローチ
代表的なオンライン講座・動画を取り上げます。
- グローバル消費インテリジェンス寄附講座演習コンテンツ 公開ページ | 東京大学松尾研究室 - Matsuo Lab
- 東京大学のデータサイエンティスト育成講座 ~Pythonで手を動かして学ぶデ―タ分析~ - 上記の書籍化版
- ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装
- ゼロから作るDeep Learning ❷ ―自然言語処理編
- 深層学習教科書 ディープラーニング G検定(ジェネラリスト) 公式テキスト
- 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 入門から実践まで
- 機械学習スタートアップシリーズ ベイズ推論による機械学習入門
- 予備校のノリで学ぶ「大学の数学・物理」 - YouTube
- Practical Deep Learning for Coders, v3 | fast.ai course v3
- How to Win a Data Science Competition: Learn from Top Kagglers | Coursera
- Stanford Artificial Intelligence Resource Hub
- Stanford University CS231n: Convolutional Neural Networks for Visual Recognition
英語情報をうまく活用するには
鮮度の高い英語情報の活用には割り切りも必要。機械翻訳の活用について。
- arXiv論文のWebページ化(とWeb翻訳) arXiv Vanity – Read academic papers from arXiv as web pages
- Jupyterノートブックの翻訳 Translating Jupyter notebook using Google Translate
2章 機械学習・深層学習の基礎を学ぼう
2.1 手書き数字識別で機械学習の流れを体感する
Colaboratoryを使ってみる
まとめと発展
- MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges
- zalandoresearch/fashion-mnist: A MNIST-like fashion product database. Benchmark
- rois-codh/kmnist: Repository for Kuzushiji-MNIST, Kuzushiji-49, and Kuzushiji-Kanji
2.2 インタラクティブに学ぶ機械学習の舞台裏
- A Neural Network Playground
- Google Cloud Platform Japan 公式ブログ: TensorFlow Playground でわかるニューラルネットワーク
- TensorFlow Playgroundの仕組み
2.3 画像認識コンペの世界を覗く
- 概要 - 人工知能技術戦略会議等主催 第1回AIチャレンジコンテスト | SIGNATE
- 評価方法 - 人工知能技術戦略会議等主催 第1回AIチャレンジコンテスト | SIGNATE
- 1602.07261 Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning
- Literate Programming - OSF | Millman_Perez_chapter.pdf
- 入賞モデル - 人工知能技術戦略会議等主催 第1回AIチャレンジコンテスト | SIGNATE
2.4 機械学習の流れ
3章 さまざまな事例を実践してみよう
こちらにはリンクを紹介します。メインはノートブックで26事例を実行し、触れてみることです。ノートブックは、サポートページ https://github.com/tomo-makes/dl-in-a-sec から試せます。
3.1 数値・表形式のデータを使った機械学習を試す
東大松尾研データサイエンス講座に取り組む
- グローバル消費インテリジェンス寄附講座演習コンテンツ 公開ページ | 東京大学松尾研究室 - Matsuo Lab
- 東京大学のデータサイエンティスト育成講座 ~Pythonで手を動かして学ぶデ―タ分析~ - 上記の書籍化版
まとめと発展
- Kaggler Slack作りました - tkm2261's blog
- Kaggleに登録したら次にやること ~ これだけやれば十分闘える!Titanicの先へ行く入門 10 Kernel ~ - Qiita
- 【随時更新】Kaggleテーブルデータコンペできっと役立つTipsまとめ - 麻か辣なら辣が好き
3.2 画像/映像を扱う深層学習を試す
概要
まとめと発展
- サーベイ論文 畳み込みニューラルネットワークの研究動向
- はじめてのGAN
- 3D CNNによる人物行動認識の動向
- Action Recognitionの歴史と最新動向
- 変わりゆく機械学習と変わらない機械学習
- CVPR 2018 完全読破チャレンジ
3.4 自然言語を扱う深層学習を試す
概要
まとめと発展
- 最新版 JSAI2018 チュートリアル「"深層学習時代の" ゼロから始める自然言語処理」
- ゼロから作るDeep Learning ❷ ―自然言語処理編
- BERT with SentencePiece を日本語 Wikipedia で学習してモデルを公開しました – 原理的には可能 – データ分析界隈の人のブログ、もとい雑記帳
- Jay Alammar – Visualizing machine learning one concept at a time
3.5 音を扱う深層学習を試す
概要
まとめと発展
- 2018/8/18 Design with .AI - AIとつくり、AIと学ぶ - vol.1 ”AIと音響/音楽のいま” セミナー資料
- Deep Learningを用いた音楽生成手法のまとめ サーベイ – Nao Tokui (Qosmo) – Medium
-
日本音響学会誌
-
日本音響学会誌 74巻9号
- 音声翻訳システムの実用化と課題
- 音声翻訳システムにおける音声変換の利用 など
-
日本音響学会誌 74巻7号
- 音声認識技術の変遷と最先端
- テキスト音声合成技術の変遷と最先端
- 音響信号処理の変遷と最先端 など
-
日本音響学会誌 74巻9号
3.6 強化学習系を試す
概要
- OpenAI Gym
- openai/baselines: OpenAI Baselines: high-quality implementations of reinforcement learning algorithms
- Welcome to Stable Baselines docs! - RL Baselines Made Easy — Stable Baselines 2.5.1 documentation
- araffin/rl-baselines-zoo: A collection of 80+ pre-trained RL agents using Stable Baselines
まとめと発展
3.7 深層学習を使ったアプリのPrototyping
JavaScriptのMLライブラリ
プロトタイプの開発環境
いろいろな作例を動かしてみる
既存のアプリ作例を見る
- [Pose Net](https://editor.p5js.org/ ml5/sketches/B1uDXDugX) - リンク切れ
まとめと発展
- yining1023/machine-learning-for-the-web: Repository for the "Machine Learning for the Web" class at ITP, NYU
- Machine Learning for Artists
4章 Colaboratory使いこなしガイド
Colaboratoryの概要、詳細は 【秒速で無料GPUを使う】深層学習実践Tips on Colaboratory - Qiita をご覧ください。
Colabを開いてみよう
ノートブックの基本操作
ノートブックのランタイム
ファイルの読み込みと保存
Colabの制約を外したい
- Google Colaboratory の ローカルランタイムへの接続 - Qiita
- Cloud Datalab - インタラクティブなデータ分析ツール | Cloud Datalab | Google Cloud
- Cloud ML Notebooks のドキュメント | Cloud Machine Learning Engine(Cloud ML Engine) | Google Cloud
おわりに
各分野を概観し、お役にたつものがあれば幸いです。
リンクはリファレンス的に使っていただいても嬉しいですし、
こんな考え方で、機械学習・深層学習のトレンドをひとっ飛びに追い、理解できる 図解速習DEEP LEARNINGも、よろしければ手にとってくださいまし