はじめに
京都大学 情報学研究科 2025年入試(2026年度春入学)を受けた受験体験記である。これを書いている8月6日現在、まだ合否は確定していない。データ科学コースの受験体験記があまりにも少ない、というか無いといってよく、自分が苦労したことも踏まえ、これから受ける人たちの参考になればいいなという思いでこの記事を書こうと思う。自分は内部生だが、院試に関して外部生と特に異なる点はないので、外部生の受験生も参考にしてほしい。合否の結果が出たら追記という形で報告しようと思う。
目次
1. 自分がどんな人か
2. データ科学コースの詳細
3. データ科学コースを選んだ理由
4. 学習に使用した書籍・資料
5. 出願・試験当日までの流れ
6. 試験の自分の出来と感想
7. おわりに
1. 自分がどんな人か
・京大工学部 情報学科 計算機科学コース (いわゆる内部生)
・GPAは2.7程度
・英語がとても苦手
・数学がとても得意 (数検1級取得済み)
2. データ科学コースの詳細
<詳細>
https://www.ds.i.kyoto-u.ac.jp/
データ科学コースは2023年に新設されたコース。私の受けた年で3期目。歴史はそう長くないが、全体の中でもかなり人気なコースである。今年の倍率は約3.2倍(枠が16人で志望が51人)だった。
<試験>
英語50点 (TOEFL120点満点を50点に圧縮)
情報学基礎100点 (線形代数・微分積分・アルゴリズムとデータ構造、すべて必答)
専門科目100点 (統計学・機械学習・情報理論・信号処理 から2科目選択)
の計250点満点である。
試験日・試験問題ともに知能情報学コースと同じ。知能情報学コースと違う点は、知能情報は専門科目で6科目(先の4科目+形式言語、認知神経科学)から2科目を選ぶのに対しデータ科学は4科目から2科目を選ぶ必要がある点と、口頭試問が行われない点である。
3. データ科学コースを選んだ理由
知能情報学コースと悩んでいた。主に学習したい内容は機械学習で、知能情報でも機械学習を研究することはできる。しかし、知能情報で機械学習を研究できる研究室はごくわずかで、それらの研究室にもし落ちた場合にほかの研究室でできる内容が少し興味から外れていた。データ科学ではどの研究室に行ったとしても機械学習の研究ができると思い、データ科学コースにした。
4. 学習に使用した書籍・資料・サイト
線形代数 : 線形代数学 (川久保 勝夫)、詳解大学院への数学 理学工学系入試問題集 改訂新版
微分積分 : 詳解大学院への数学 理学工学系入試問題集 改訂新版
アルゴリズム : データ構造とアルゴリズム (杉原 厚吉)
統計学 : 現代数理統計学の基礎 (久保川 達也)、統計WEB
信号処理 : やる夫で学ぶディジタル信号処理 (鏡 慎吾)、工業大学生ももやまのうさぎ塾
5. 試験当日までの流れ
学部3回まで
ただ普通に学部生活を送っていた。特に院試のことなどは考えず、期末試験に追われながら単位を集めていた。
3月
英語をそろそろ受けないとまずいと思い焦りはじめる。この時点ではまだコースも研究室も決めていなかったが、知能情報かデータ科学を受けるつもりだったので、TOEFLを受けることにした。1回目のTOEFLを受けた。
4月・5月
TOEFLの結果が返ってきた、50/120。まずいと思い、もう一回受けることにした。二回目の受験は5月の末、結果は57/120。全然良くないが、これ以上英語に時間をかけられないと思い英語を諦め、当日試験の科目に注力することにした。
6月半ばまで
線形代数・微分積分はすでに得意科目だったのでいったん置いておいて、アルゴリズム・統計学・信号処理の理論を一通りさらった。もともと授業や数検1級の対策をしたときの知識があったため、大きくつまずくことはなかったが、この時点での理解度は全然十分ではなかった。
7月1週目まで
過去問を2017まで解いた。過去問演習は解答がないのが多くの受験生にとっての問題だと思う。僕は知能情報を受ける友人が一定数いたので、みんなでワークスペースを作り、そこに解いた過去問の解答をあげて確認するということをやっていた。また、生成AIにも助けを求めた。自分が解いた問題を採点してもらう、問題の解説をしてもらうなどに利用した。時々間違いはあったものの、生成AIの進化は著しいことに改めて驚かされた。
7月2週目
ある程度過去問で問題演習をしたので、もう一回理論のインプットに注力した。資料を見ながら理論の流れをさらい、それが出来たら資料を何も見ずに理論の流れを自分で再現できるようにする、その流れが正しいかを資料を見て見直しする、という流れで学習した。
7月3週目
家で一人で勉強していることがしんどくなり、実家に帰った。乱れがちだった生活習慣を正すことができた。過去問を直近数年分解いたうえで、圧倒的に問題演習が足りないと感じたため、生成AIに模擬試験を作らせて時間を計って解くということを毎日繰り返していた。模擬試験で不足している知識が何かを洗い出し、その分野を書籍や資料を参照して補完する、というのを繰り返していた。
7月4週目
模擬試験を解くことは引き続き毎日行った。求値問題を解けるくらいの理解度は定着していたが、記述問題に対処できるほどの理解度は無いと思い、徹底的に記述対策を行った。記述対策で覚えるべき事項が多すぎたため、統計・信号処理の二科目のみの対策でいいのかという迷いが生じた。情報理論と機械学習の資料を少し見始めたが、今からやっても統計・信号処理ほどの完成度にすることは不可能だと思い、腹をくくって記述対策に注力した。
試験一週間前
これ以上新しいことを覚えるのは不可能だと判断した。今までに解いた過去問や模擬試験をおさらいし、試験の時に気を付けること・忘れがちな発想などをまとめた。学習の際にまとめたノートや公式集を整備し、試験前日や直前に見返して思い出せるようにした。
試験前々日・前日
実家から下宿に戻り、最後の調整をした。当日の持ち物を確認し、準備したノートや公式集を見返した。普段iPadで学習をしていたので、紙とペンで試験を受けることに慣れるために最新の過去問を紙とペンで解いた。前日はとにかく早く寝た。
試験当日
朝7:00に起き、8:00には大学のラウンジに着き、知能情報を受ける友人たちと直前に確認すべき事項を確認しあった。友人にはデータ科学を受ける人がいなかったので、試験室に行くときは一人だった。ガチガチに緊張していたが、やれることはやったと思って自信をもって挑んだ。
6. 試験の自分の出来と感想
情報学基礎
所感
傾向がかなり変化した。それぞれの問題は絶対に解けないほどの重さではないが、問題数が圧倒的に増え、全問を完答しきるのは至難。ある程度の減点は許容したうえで試験時間内にどの問題を取るかという選択をうまくできるかが明暗を分けるだろうなという感じ。試験全体のセットとしての難易度は相当高いと思われる。
F-1-1(線形代数)
問1: 設定がよく分からず、(3)までは機械的に解いたが、(4)が解けず。
問2: rankが出るとは思わなかった。即座に解法が思いつかなかったのでいったん飛ばしたのち、結局白紙。
F-1-2(微分積分)
問1: 完答。ラグランジュで解いた。相加相乗のほうが早いことに終了してから気づいた。
問2: 完答。ライプニッツやるだけ。
問3: (1)は$y=kx$でオーケー、(2)はよくわかんなかったので飛ばしたのち、結局白紙。
F-2-1(アルゴリズム)
問1: 完答。ダイクストラの過程を描くか迷い、(1)は書いて(2)は書かなかった。
問2: 設定の理解に少し時間を使ったが、完答。(3)は特に難しいと思う。
F-2-2(アルゴリズム)
問1: 最小全域木求める問題、完答。(1)で説明書いたせいで(3)で書くことなくなって困った。
問2: Prim法。(2)でkeyが小さい順を見落とし、減点されてると思う。
問3: Kruskal法。重そうだったのと線形と微積の残り回収したほうがいいと思い白紙。(1)(2)くらいまで解いておけばよかった。
専門科目
所感
統計学も信号処理も傾向がガラッと変わった。統計は過去20年でも出てなかったベイズが出たり、5年前が最後だった記述問題が復活したり。信号処理も問1はそんなに変わっていないとはいえ、問2は典型問題の類ではないだろう。過去問対策で過去問に過学習した人間を殺しに来ている、ちゃんと理解している人を取るという問題作成者の意思を強く感じた。
S-1(統計学)
問1: ベイズの定理で二項ベータの事後分布を導出する問題、完答。やったことあれば何の苦もないし、一回もやったことなければ厳しいかもしれない。
問2: 確率変数の和とかに関する問題。(3)まで完答したが、(4)で連立方程式を解きミスし、(5)の記述はおそらく減点されている。
問3: 効果量に関する記述問題、8割くらい。(1)でCohen's dとかいう知らないものが出たが、かっこ書きの説明文だけで何とか書ききった。(2)は(1)と関係ないので、こちらはまだ書きやすい記述だったと思う。
S-4(信号処理)
問1: z変換に関する問題。(1)でうるさく収束域の話をしているので、(2)の収束域にちゃんと着目していれば反因果的信号に気付くはず。(3)で変数変換の際の符号をミスした、減点されていると思う。
問2: Wiener-Hopf方程式の導出に関する問題、完答。(1)は期待値が線形であることを知っていて、かつ線形代数学的な式変形が出来さえすれば信号処理の知識は一切必要ない。(2)はベクトルの式をベクトルで偏微分することに慣れていないと厳しいかもしれない。信号処理の問題といえるかはかなり怪しいが、知らない事象に怖がらなければ得点源といえる問題だろう。
点数予想
情報学基礎
F-1-1: 10/25
F-1-2: 20/25
F-2-1: 25/25
F-2-2: 15/25
計: 70/100
専門科目
S-1: 40/50
S-4: 45/50
計: 85/100
英語: 23.75/50
計: 178.75/250
7. おわりに
明確に院試を意識しだしてから半年、かなり頑張ったと思う。苦手な英語に向き合い、それでも点が取れず。得意な数学をやっていても、どれだけやってもやっても終わりが見えない感じ。辛かった。
他のコースにもそれぞれ大変なポイントがあるとは思うけれど、個人的にデータ科学でしんどかったのは「過去に2年しか入試が行われてないせいでデータがない」という点と、「枠が少なすぎるがゆえに、ずば抜けた人が1人いるだけで合格点が急激に上がる」という点だ。データがないせいで内部生すら合格最低点の大まかな目安のつけようがないし、1人でもすごい人がいたらという点でそもそも合格最低点を推定することに意味がない。そのせいで、どれだけ高い点数でも満点以外は合格が確定じゃないという考えが勉強中も、試験中も、試験後も頭から離れなかった。だからこそ、すべての科目で満点を取りに行く勉強をした自信はあるし、試験でケアレスミスをしたことや解ける問題を捨てたということへの後悔はつきまとう。
もし今後データ科学または知能情報を受ける人がこの記事を読んでいるとしたら、可能な限り早く対策を始めてほしい。今年の問題は付け焼刃の知識で解けるものではなかったし、今年と同じような倍率が続くのであれば今後もきちんと理解していないと解けないという傾向は変化しないと思う。だからこそ、内容の「本質的な理解」にちゃんと多くの時間を割いてほしい。
この記事を読んだすべての人が院試に合格することを心から祈っている。