0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

いまさら解説する「データ加工」 §0

Posted at

今回から不定期に、データ加工についての基本技術を発信していこうと思います。

自己紹介

「お前、誰だよ」「どんだけ経験積んだん?」と言われそうなので、まず軽く自己紹介を。:angel:
(※はよ話せという人は飛ばしてどうぞ)

・社会人経験6年目
・データサイエンス界隈には4か月くらい
・今までプログラミングはおろか、大学のパソコンの授業は一番下のレベル

と、まあ要はド素人なわけですわ。そのド素人の私が、ここ数か月で学習したことをここでつらつらと発信していきますので、先輩データ分析ニキネキたちは生暖かい目で、後輩データ分析ニキネキたちは「なんやこいつ、こんなん俺でもできるわ」とにやにやしていてください。

記事の方向性

この記事では、以下のことを書いていこうと思います。

・データ分析処理を行う上での心構え
・簡単なデータ分析の処理技術
・私の学習歴

などなどを書いていきます。書いてほしいこととか、あれば教えてください。なんでもしま…:boy_tone5:

私の学習歴

現在私は以下のことをやっております。

a) Signateを利用した学習
b) 書籍を活用した学習
c) 資格取得を活用した学習

a) Signateを利用した学習

What is Signate?

まずはSignateについて簡単に説明をば。(ご存じなニキネキたちは飛ばしてどうぞ)
Signateは一言でいえば「データ分析コンペ」です。要は与えられたデータから、予測モデルを作りその精度を競う、つよつよな人が集う世界です。

ところでデータ分析コンペといえば「Kaggle」が思いつくニキネキもいると思いますが、これとは全く違います。
何が違うって、もうそれはすべてがですね「日!本!語!」なのですよ。。。
いやいや最近はKaggleだって日本語版の本とか出てるし余裕でしょ?って思いますよね?そりゃただ普通にやる分には、まあいけると思いますよ(くっそどうでもいいですが、私も英語はそれなりにわかりますし)。
ただ予期せぬ事態が起こったとき「母国語のほうが安心しませんか?安心しますよね!」ということでSignateを選びまし…

たというわけではないのですよ。
ちゃんと理由はあります。それは

「あなたはデータをはいと渡されてすぐ分析できますか?!?」

ということにあります。

このSignateの最高なのは、課金すると(ここ重要)データ分析の手法を学べるのですよ、しかもハンズオン形式で環境設定不要で。これ最高Of最高じゃないですか?
私のようなペーぺーは何からやればいいかわからなくて困りました。なので今はこれをせかせかとやっております。
これほんといいですよ、まじで(Signateさん、宣伝してあげたから無料にしてくれないかな…(小声))。

んで、これは後述するんですけど、入門書との相性がエド・〇るみよろしくバッチグー:thumbsup:です。

b) 書籍を活用した学習

「じゃあ、その入門書って何やねん」って話なので、とっとと言います。

・『東京大学のデータサイエンティスト育成講座』

です。まじ魔本です。pythonのさわりをやって、各種ライブラリをやり、機械学習を学習します。
私のようなド素人はですね、パソコンに打ち込んでその通りに動くだけで興奮するんですよ。「やった動いた!!」みたいな感じで。

なので、データサイエンスに興味あるニキネキはとりあえずこの本を買って勉強しような:punch_tone2:

余談ですがこの本の良きポイントはほかにもあって
・余白が多い
・参考文献が豊富に載っている
ということが挙げられます。

参考文献は言わずもがな、学習の道順を示してくれるダンジョンマップです。載っているとテンション上がります。だってまだこんなに勉強できるんだ!!と思わせてくれるんですよ???

じゃあ、余白が多いのはなんでいいんでしょうか。中身スカスカなのでは?と思いませんか?答えはもちろんNoです。

自分の学習やあれやこれやで学んだことをどんどんと書き込んでいけるんですよ。最高じゃないですか?
そうやって魔本を作り育てていくんです、そう、令和は「本は育てる」時代です。ということで少々大判な本ではありますが、電子書籍よりも紙の本を買ったほうが良いと思います。

ほかにもいい本はあると思いますが(事実私はほかにも持っていますが)、とりあえず今日のところはこの辺で。

c) 資格取得を活用した学習

最後に資格試験です。データサイエンス界隈は最近いろんな資格が勃興しておりますが、私は

・統計検定 準一級以上(できれば一級)
・データベーススペシャリスト

を学習しております。
理由は簡単で、そんなに簡単な試験ではないからです。簡単な試験はそれだけライバルも多いし、わかったような気にさせるだけのことも多いです。「道を極めるなら(その道で食っていくなら)少々高い山でも登っていくべき」が私の信条です。

結びに変えて

「未経験からでもOK‼最短三か月で給料がXX万円に‼」みたいなものも最近は見かけますが、どんな業界でも仕事はそんなにやさしいものではない。この記事をここまで読んでくれたニキネキは普段仕事なり勉強なりを一生懸命やっているはずです。「いやいや、そんなやってないよ」というかもしれませんが、ほんとは遊びたいし眠たいし、というようなものを抑えて対峙しているわけです。

そんなニキネキだからこそ「お前も鬼(道を極めた人)にならないか?」という言葉で締めます。
データサイエンスはそんなに甘くない、ことを痛感したからこそ、その面白さに引き込まれました。その面白さが少しでも伝わればうれしいです。

※次回からが本編です(失踪しないように願っててください)。

 

0
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?