動機
研究室配属が差し迫っている今、自分が研究したい分野を知るためにも更に勉強が必要だと感じています。
そのために、本を読んだりコードを書いたりしながら、見返しやすい様まとめながら記事を書いていこうと思っています!
専門的知識もあまりないので、初心者なりに頑張っていこうと思います💪
今回題材に選んだ本は、研究室の先生に勧めていただいた、
「本質を捉えたデータ分析のための分析モデル入門」(杉山聡)
というものです。
下のリンクから購入できるので、一緒に読み進めてもらえたりしたら嬉しいです!
本質を捉えたデータ分析のための分析モデル入門
ゴール
この本には様々な分析モデルが紹介・説明されているそうなので、春休みの終わりまでに読み終わって以下のことができる様になるのが今回の目標です!
- 一般的な分析手法を学ぶ
- 分析タスクに対して最適の分析モデルを選べる様になる
早速本題です!
序章 (ベクトル内積とベイズの定理)
最低限の数学の知識が書いてありました。
「ベクトル内積」や「ベイズの定理」ついて簡単に説明されていました。
「内積は類似度を示す」というのは何度が大学の授業でやっていたので、復習となりました。
以前RAGを触った際にもcosine similarityなどについてちょっと触れていたので、読んでいて面白かったです。
ベイズの定理は条件確立に関しての定理だよなぁという浅い理解しかできていなかったので、ここは勉強になりました。
ベイズの定理の本質は、「時間的に逆行する条件付き確率を、時間順行の条件付き確率に書き換えられる。」というものでした。
また、一般的にデータ分析は結果→原因の推定(時間逆行)なので、ベイズの定理が多用されるとわかりました。