はじめに
様々な分野で多様なビッグデータが得られるようになり、こうしたデータを解析し、そこから「知」を得るための手段として、機械学習 (Machine Learning)、いわゆるAIが注目されています。そういった動きは、農学の分野でも広がってきており、我々**生物測定学研究室**でも、圃場のモニタリングに画像解析技術を用いたり、育種(品種改良)に機械学習のアイディアを応用した研究を行ったりしています。
こうした状況を鑑みて、本研究室では2020年前期(4月〜8月)に、機械学習の教科書の決定版ともいえる、Christopher Bishopによる**『Pattern Recognition and Machine Learning (パターン認識と機械学習)』、通称PRMLに関する輪読会を開講しました。本輪読会では、PRMLの各章の末尾に付いている演習問題**を、輪読会参加者の有志が解く、ということも行いました。ここでは、各人による演習問題の解答例をQiita
の記事として紹介していこうと思います。
(追記:2021年度後期も輪読会を開催し、第1章から勉強しています。昨年度できなかった演習問題は随時更新予定です。)
本記事では、第1章の演習問題の解答例に関する記事のリンクを紹介していきます。
なお、第1章の解答例に関する記事は少ないですが、第2章以降はもう少し増えます。
また、まだ解いた全ての問題を公開しているわけではなく、随時更新していきます。更新内容などについては、Twitter
にてご報告する予定です。
(注:解答例は、数学の決して得意ではない学生によるものもあります。中には間違いや不十分な解答もあるかもしれませんが、温かい目で見ていただき、コメントで誤りなどを指摘していただければ幸いです。また、全ての問題に対して解答例が用意されているわけではないので、その点についてもご了承ください。)
関連記事など
別の章に関するリンク集
PRML 公式資料
- PRML 一式 ダウンロードページ (公式)
- PRML 英語版 フルPDF (公式・無料)
- PRML 日本語訳 上巻 (Amazon)
- PRML 日本語訳 下巻 (Amazon)
- PRML 英語版 公式解答例 (wwwの付いた一部の問題)
PRML 非公式資料
- PRML演習問題 全問解答: PRMLの第1章 ~ 第3章の途中 (演習問題3.24) までのほぼ全ての問題の解答を手書きで載せています。
- PRML演習問題1.1: この方はQiitaの記事として、演習問題を1.1 ~ 1.4まで手書きで解いています。
-
PRML復活の呪文 part1 (1.1): この方は
PRML
の日本語版の上巻の最後まで、各章を何パートかに分けて解説した記事を載せてます。また説明の中で、一部の演習問題の解説を行なっています。 -
PRML演習問題解答を全力で分かりやすく解説!: この方は
PRML
の演習問題の数多く(ほとんど)の問題を、第1章から第10章まで手書きで公開しています。 - その他PRMLのタグがついたQiitaの記事一覧
他にも、一部の記事でPRMLの演習問題の解答例に関する記事があるものの、どれも1問単位で解かれており、このようなLaTeXで数式を書いた解答例のリンク集は存在しないように見受けられます。
担当者
東京大学 生物測定学研究室の @YusukeToda1984 さん, @ZaKama さん, @patten さん, @Kazutoshi08 さん, @mashiro135 さんにご協力いただきました。また、他にも(生物測定学研究室以外の学生を含む)2名の有志が匿名で公開に協力してくださいました。こちらの2名の方の記事はこのアカウントの記事として投稿させていただいもののリンクを紹介したいと思います(当人の許可をとっています)。
解答 リンク集
演習問題 1.1 (基本), 演習問題 1.2 (基本)
(正則化された)二乗和誤差関数を最小化する係数が満たす線形方程式を書き下せ、という問題ですね。
演習問題 1.4 (基本)
- PRML 演習問題 1.4 (@mashiro135 さん、2021.11.16に公開)
演習問題 1.7 (標準)
- PRML 演習問題 1.7 (標準) (匿名Aさん、@Lab_of_Biomet より公開)
1変数ガウス分布に関する規格化条件を証明する問題です。極座標変換を行うと証明ができる、という特徴的な問題ですね。
演習問題 1.9 (基本)
- PRML 演習問題 1.9 (基本)解答 (@yu10_I さん、2021.11.16に公開)
ガウス分布や多変量ガウス分布のモードが $\mu$ であることを証明する問題です。
演習問題 1.14 (標準)
2次の多項式のパラメータの数が、実は結構少なく済むよ、という問題ですね。対称行列と反対称行列の性質から証明しています。
演習問題 1.25 (基本)
二乗損失関数による期待損失を最小化する関数が、観測値の説明変数に関する条件付き期待値になることを証明する問題です。実は、損失関数が二乗損失関数でない場合は、この関数形は変化します。詳細は、演習問題 1.27 を解いてみるといいでしょう。
演習問題 1.28 (基本)
情報量を表す関数h(x)が満たすべき形についての証明です。
演習問題 1.31 (標準)
2つの変数の同時分布の微分エントロピーが、それぞれの変数の微分エントロピーの和以下になることを証明する問題です。この問題を証明するには、微分エントロピー、カルバック-ライブラーダイバージェンス、相互情報量など、情報理論に関連する事柄を理解する必要があるので、是非この問題を解いて復習しましょう。
その他 (演習問題以外の輪読会関連記事)
損失関数が二乗和誤差関数であるときの、期待損失の導入に関する記事です。輪読会中に質問があったので、記事にしました。
おわりに (宣伝)
いかがだったでしょうか。
こうした記事が、少しでも皆さんがPRMLの演習問題を解く上での理解の助けとなれば幸いです。
誤りなどありましたら、各演習問題に対する解答記事にてコメントなど残していただければと思います。
さて、生物測定学研究室では、農学という分野にいながら、このような機械学習の基礎から勉強しているほか、プログラミング言語(Python
, R
, C++
, Julia
など)を駆使して、効率的なデータ取得や、品種改良の高速化に取り組んでいます。興味がある方は、ぜひホームページから研究紹介動画を見ていただければと思います。Twitter
もはじめました。
研究室ホームページ: 東京大学 生物測定学研究室
研究紹介動画など (YouTube): 東京大学 生物測定学研究室 YouTubeチャンネル
Twitterアカウント: UT-Biomet (@BiometUt)
Twitterサブアカウント: 東大・生測の日常。 (@BiometUtDiary) ←New!! (2021.10-)
更新歴
- 2021.11.16 : 2021年度輪読会について、記述しました。一部体裁を整えました。
- 2021.10.29 : Twitterサブアカウントを掲載しました。