自己紹介も兼ねた駄文から始めてみようと思う。
世の中AI(人工知能)ブームである。一昔前、AIといえばAction Itemを指していたが今や「AIって書くと紛らわしいからアクションアイテムって書けよ」と言われる(実話)時代になった。
現在は第3次人工知能ブームということで、いろんな人が「我が社もAIに取り組まないとけない」と鼻息が荒くなってきた。自分はといえば、データ分析の重要性についてはなんとなく認識しつつ、目立つWebページなんかはつまみ食いしていて、なんとなく概要はわかっていたものの、体系的に勉強したり技術をつけるということは年齢的なものや仕事を理由にこれまで避けてきた。
ところが、いろんなWebや書籍などの情報を見れば見るほどデータがいかに大事かということに気づく。その昔パソコンが使えるとヲタクだと言われたが、自分がその時に感じた、これ(コンピュータ)は将来くるぞという感覚に似たものを感じた。これは乗るしかない、この大波に!というわけで、何周遅れかわからないほど遅れているが、データサイエンティストの勉強の経過を記していこうと思う。
筆者のスペックや経験など
- 小学生の時にMSX BASICに触れる
- 中学生でマイコンBASICマガジン(通称ベーマガ)の写経を覚える
- 執念で親にFM-TOWNSを買ってもらう
- カーネルのバージョンがまだ0.9とかの時代にLinuxに出会う
- 首都圏の某大学で情報工学を専攻、コンピュータサイエンスはそれなりに学んだが、なぜか半導体工学の研究室に進み、大学院はなんとか卒業
- 理系の道を歩んだので、数学や物理の知識はまー人並みの大学レベル
- 某メーカーに就職したものの、技術どっぷりというよりは企画屋みたいなことをしている
- 仕事とは無関係に、RubyやPythonやJavascriptなどは趣味として嗜む程度
- 業務上それなりに大量のデータに触れることはあるが、AccessやExcelのピボットがわかればなんとかなる程度ではある
- 楽器演奏や写真を趣味にしてる
- などなど
データサイエンティストの定義
人それぞれ思うところはあるだろうが、データサイエンティスト協会は、2014年12月10日のプレスリリースにおいて、以下のようにデータサイエンティストを定義していた。
「データサイエンティストとは、データサイエンス力、データエンジニアリング力をベースにデータから価値を創出し、ビジネス課題に答えを出すプロフェッショナル」
つまり、データを分析する高度なスキルを持っているだけではダメで、クライアントの課題をビジネスの観点から的確に捉え、課題に見合ったデータを定義し、高度な分析をもとに問題を解決するアプローチを取れることが必要になるという理解をした。
今後書いていくこと
自らをデータサイエンティストと言えるところまで持ち上げるにあたって学習したことを自分なりにアウトプットすることを目標にする。
機械学習
いわゆるG検定レベルの知識を網羅したい
- 教師あり学習や教師なし学習の具体的な内容とか理論とか手法とか
- ニューラルネットワークやディープラーニングについて
- できれば研究や応用分野について
コーディング
Pythonを使って、kaggleなんかに取り組みながらライブラリの使い方なんかをまとめていこうかなーと
正直日経XTECHさんにこんな記事を出されてしまうとあと書くことなくなってしまうのが本音だが、自分の学習用として割り切って書いていこうと思っています。よろしくどうぞ。