みなさまはじめまして。本日からQiitaを始めたyamaryu777です。
ふとしたことからデータサイエンス界隈の勉強・分析は
足掛け9年(うち4年間は本業にかまけて冬眠)してたことに気づき、
しかもそれが本業に生きることもなく来てしまっていたので、
これを機に何かしらのアウトプットをここに残していければいいなと思っています。
他の方の役に立つようなことを書こうなんて恐れ多くて思えませんが
自分がやってきたことやこれからやることを備忘録がてら書いていこうと思います。
自己紹介
- 学部時代(工学部)に数値流体力学(CFD)がきっかけでプログラミングを始める。
- 大学院で計量経済学に出会い、思えばこれがデータサイエンスとの出会い。(当時はそんな認識はなかったです。)
- Fortranから始め、その後C, C++(途中で飽きる), Ruby, R, Stata, Pythonと触り、大学院時代はRとStataをメインに使用。
- 計量経済学をメインにやっていた傍ら、有志での機械学習勉強会にて機械学習を学び始める。当時は全てRで実装。
- その後、データサイエンスとは別の道で就職して4年で海外MBA取得を決意し、今に至る。
- MBA2年目に計量経済分析を活用する機会があり、それを機にデータサイエンス再入門。
- Udemy講師のJose Portilla氏の講義を中心にリハビリを兼ねた勉強中。(←Jose Portilla氏は分かりやすい英語を話してくれますし、構成や内容もしっかり練られているので、英語でも構わない方にはおすすめです。)
- とりあえずの目標は競馬で安定的にお小遣いを稼ぐこと。
作業環境
- MacBook Pro (Early 2013, Core i5 2.6GHz, RAM8GB)
- iPad (第6世代) + inateckキーボードケース
- Google Colaboratory
- Python(Anaconda), Postgre SQL, AWS
はじめはMacにAnacondaを入れてローカル環境で作業していましたが、Deep Learning始めてから計算時間が長くなりすぎたので、今はPythonについてはColaboratory上で全て済ませています。
たまにAWS EC2上に立てたUbuntuでPySpark使うこともあります。
おわりに
一応まだ現役?のMBA学生なので、どこまで更新できるか分かりませんが
できるだけ書いていきたいと思っています。
UdemyのJose Portilla氏がやっている講義で目ぼしいものはだいたいこなしてしまったので、
今後はKaggleのデータセットや自分の興味のある分野(競馬とは)で応用していきたいと思います。
了