はじめに
様々な分野で多様なビッグデータが得られるようになり、こうしたデータを解析し、そこから「知」を得るための手段として、機械学習 (Machine Learning)、いわゆるAIが注目されています。そういった動きは、農学の分野でも広がってきており、我々**生物測定学研究室**でも、圃場のモニタリングに画像解析技術を用いたり、育種(品種改良)に機械学習のアイディアを応用した研究を行ったりしています。
こうした状況を鑑みて、本研究室では2020年前期(4月〜8月)に、機械学習の教科書の決定版ともいえる、Christopher Bishopによる**『Pattern Recognition and Machine Learning (パターン認識と機械学習)』、通称PRMLに関する輪読会を開講しました。本輪読会では、PRMLの各章の末尾に付いている演習問題**を、輪読会参加者の有志が解く、ということも行いました。ここでは、各人による演習問題の解答例をQiita
の記事として紹介していこうと思います。
(追記:2021年度後期も輪読会を開催し、第1章から勉強しています。昨年度できなかった演習問題は随時更新予定です。)
本記事では、第3章の演習問題の解答例に関する記事のリンクを紹介していきます。
まだ解いた全ての問題を公開しているわけではなく、随時更新していきます。更新内容などについては、Twitter
にてご報告する予定です。
(注:解答例は、数学の決して得意ではない学生によるものもあります。中には間違いや不十分な解答もあるかもしれませんが、温かい目で見ていただき、コメントで誤りなどを指摘していただければ幸いです。また、全ての問題に対して解答例が用意されているわけではないので、その点についてもご了承ください。)
関連記事など
別の章に関するリンク集
PRML 公式資料
- PRML 一式 ダウンロードページ (公式)
- PRML 英語版 フルPDF (公式・無料)
- PRML 日本語訳 上巻 (Amazon)
- PRML 日本語訳 下巻 (Amazon)
- PRML 英語版 公式解答例 (wwwの付いた一部の問題)
PRML 非公式資料
- PRML演習問題 全問解答: PRMLの第1章 ~ 第3章の途中 (演習問題3.24) までのほぼ全ての問題の解答を手書きで載せています。
-
PRML復活の呪文 part8 (3.1 - 3.1.3): この方は
PRML
の日本語版の上巻の最後まで、各章を何パートかに分けて解説した記事を載せてます。また説明の中で、一部の演習問題の解説を行なっています。 -
PRML演習問題解答を全力で分かりやすく解説!: この方は
PRML
の演習問題の数多く(ほとんど)の問題を、第1章から第10章まで手書きで公開しています。 - PRML 演習3.17解説
- その他PRMLのタグがついたQiitaの記事一覧
他にも、一部の記事でPRMLの演習問題の解答例に関する記事があるものの、どれも1問単位で解かれており、このようなLaTeXで数式を書いた解答例のリンク集は存在しないように見受けられます。
担当者
東京大学 生物測定学研究室の @YusukeToda1984 さん, @ZaKama さん, @patten さん, @Kazutoshi08 さん, @mashiro135 さんにご協力いただきました。また、他にも(生物測定学研究室以外の学生を含む)2名の有志が匿名で公開に協力してくださいました。こちらの2名の方の記事はこのアカウントの記事として投稿させていただいもののリンクを紹介したいと思います(当人の許可をとっています)。
解答 リンク集
演習問題 3.4 (基本)
- PRML 演習問題 3.4 解答 (@patten さん)
目的変数でなく、入力変数に誤差が加わった時に、ノイズの分布に関する期待二乗損失を最小化することの意味について考える問題です。入力変数に誤差が加わることを想定することは珍しいですが、現実には十分ありうることなので、興味深い問題と言えますね。
演習問題 3.5 (基本)
正則化誤差関数の最小化が、正則化されていない二乗和誤差のある制約条件下での最小化に等価であることを示す問題です。ラグランジュ未定乗数法を用います。
演習問題 3.10 (標準)
2章で学んだガウス分布の公式を用いて、ベイズ線形回帰の予測分布を直接導出する問題です。
演習問題 3.11 (標準)
パラメータの事後分布の不確かさが、データ集合のサイズが増えると、必ず減少する、ということを証明する問題ですね。どんなデータ点を取ってきても不確かさが必ず減少する、というのは興味深い事実です。
演習問題 3.14 (標準)
等価カーネルにおいてある仮定のもとで成り立つ法則についての証明です。カーネルに関しては6章で詳しく学びますが、ここでも少し触れています。
演習問題 3.16 (標準)
2章で学んだガウス分布に関するガウス分布の公式を応用することで、線形回帰モデルにおける対数エビデンス関数の結果を導く問題です。
演習問題 3.17 (基本)
- PRML 演習問題 3.17(基本) (匿名Aさん)
線形回帰モデルにおける対数エビデンス関数の形を、二乗和誤差関数を用いて変形する、という問題です。
演習問題 3.18 (標準)
ベイズ線形回帰における誤差関数を、平方完成する問題です。
演習問題 3.19 (標準)
ベイズ線形回帰のモデルをパラメータに関して周辺化し、対数周辺尤度を計算することで、対数エビデンスの形を導く、という問題です。
演習問題 3.20 (標準)
対数エビデンスの最大化によるハイパーパラメータ $\alpha$ の最適化を行うことが、再推定方程式
$(3.92)$ に帰着されることを証明する問題ですね。
おわりに (宣伝)
いかがだったでしょうか。
こうした記事が、少しでも皆さんがPRMLの演習問題を解く上での理解の助けとなれば幸いです。
誤りなどありましたら、各演習問題に対する解答記事にてコメントなど残していただければと思います。
さて、生物測定学研究室では、農学という分野にいながら、このような機械学習の基礎から勉強しているほか、プログラミング言語(Python
, R
, C++
, Julia
など)を駆使して、効率的なデータ取得や、品種改良の高速化に取り組んでいます。興味がある方は、ぜひホームページから研究紹介動画を見ていただければと思います。Twitter
もはじめました。
研究室ホームページ: 東京大学 生物測定学研究室
研究紹介動画など (YouTube): 東京大学 生物測定学研究室 YouTubeチャンネル
Twitterアカウント: UT-Biomet (@BiometUt)
Twitterサブアカウント: 東大・生測の日常。 (@BiometUtDiary) ←New!! (2021.10-)
更新歴
- 2021.11.16 : 2021年度輪読会について、記述しました。
- 2021.10.29 : Twitterサブアカウントを掲載しました。