データ分析
データサイエンス
勉強法

【翻訳】データアナリストからデータサイエンティストへの道~AIに仕事を奪われる事を心配しないで

仕事の関係で取引先のIT部門と付き合うことが多いので、今の仕事がいつかAIに奪われるか心配しているという話はよくデータアナリストから聞きました。確かに、分析業務がツールやAIによって自動化されているトレンドで、企業の課題に対するデータの解析を主な仕事内容とするデータアナリストはだんだん無くなる恐れがあります。したがって、たくさんのデータアナリストはデータサイエンティストに進めると考えているのです。

2013年の日経新聞の記事ですが、米調査会社ガートナーによると、日本でも将来的には25万人ものデータサイエンティストが不足する見通しです。

ネットで調べると、データサイエンスとデータアナリストの違いに関する内容は多いですが、どうやってデータアナリストからデータサイエンティストになれるかについての日本語の内容はほとんどないようです。

今回はイギリスのデータサイエンティストであるBen Stanbury氏の記事「From Data Analyst to Data Scientist」を翻訳して、ご参考いただければ幸いです。間違っているところがあったらご指摘ください

image2019-3-12 17_17_44.png

以下は翻訳です。



どうやってデータアナリストからデータサイエンティストになれますか?三つのステップで行けます!

1.LinkedInのWebサイトにログイン

2.「公開プロフィールの編集」をクリック

3.「データアナリスト」という単語をすべて「データサイエンティスト」に置き換る

はい、終わり。簡単ですよね。

残念ながら現実はそれほど簡単ではありません。インサイトが得られる分析力を養うことが難しいと認めなければなりません。

初心者向けのデータサイエンスの勉強法に関しては、素晴らしい記事はたくさんありますが、データアナリストからデータサイエンティストになることはあまり言及されません。


データアナリストとデータサイエンティストの違い

それを紹介する前に、まずデータアナリストとデータサイエンティストの違いを説明します。、

データアナリストは、利益を生み出して、意思決定を改善するために、データの収集と処理の上で、アルゴリズムで構造化データを分析する職業です。

データサイエンティストは同じ目標を持っている一方、大量の非構造化データを扱って、リアルタイムでデータを処理するための高度なスキルも必要です。

彼らは重要な情報を発見し、さまざまなソースからのデータを加工して、アルゴリズムを応用します。それに、ストーリーテリングとデータ可視化のスキルも高いです。


なぜデータサイエンティストになるのですか?

そういえば、理由がいろいろあります。


影響力

データサイエンティストになれば、利益を発見し、飛躍的に成長させる可能性があります。そのうえ、高い立場から提案して、企業の方向性を決めることまでに役立ちます。


熟達化

急速に発展しているデータサイエンスの分野では、まだ解決していない課題が溜まっています。そのおもしろい課題を解決するには、様々な方法を利用できます。たとえば、SNSでの悪意のコメントを識別するための画像認識機能やテキスト分類機能の開発などです。


関連性

AIが最終的に私たちの仕事を奪うと予測される中、AIに代わられるのを待つより、自動化のことを創造するほうかいいんじゃんありませんか。


給料/チャンス

ヨット旅行をして、ジャグジーでシャンパンを飲むほどの贅沢な生活になることがないですが、データサイエンティストの給料は比較的高いです。優秀なデータサイエンティストが少なくて、人材のニーズも高まっています。良い生活のために、データサイエンティストになりましょう。


すでにデータサイエンティストになっていますか?

整っていない大規模データに最先端のアプローチを全体的に応用するためのスキルを習得するには何年もの努力が必要ですが、ほとんどのアナリストは十分の基礎知識を持っているので、データサイエンティストになるまでに時間が想像以上に短いと言えます。

では、どのようなスキルに取り組むすべきですか?その質問に対する正しい答えはおそらくないですが、複雑なデータサイエンスのプロジェクトに多くの要素を含む子プロジェクトがあるから、最初のデータサイエンス開発では、少なくとも以下のスキルが求められます。

データサイエンス言語 - Python / R

リレーショナルデータベース - MySQL、Postgress

非リレーショナルデータベース - MongoDB

機械学習モデル - 例えば、回帰(Regression)、ブースティング木(Boosted Trees)、(サポートベクターマシン)SVM、NNs

グラフ- Neo4J、GraphX

分散コンピューティング - Hadoop、Spark

クラウド - GCP / AWS / Azure

API Interaction - OAuth、Rest

データ可視化とWebアプリケーション - D3、RShiny

専門分野 - 自然言語処理(NLP)、光学的文字認識(OCR)、コンピュータビジョン(CV)

以上のスキルの習得に時間がかなりかかります(たぶん学位の取得よりも長い)。 世界中一番優秀なデータサイエンティストでさえ、学ぶべきことがまだいろいろあります。 しかし、私たちは常に多くの知識に触れるので、限界があることを心配すべきではありません。 毎日少しでも良くなれば、ある日高いレベルに到達する潜在能力があります。

一言いえば、成功するには決心力と粘り強さは知的能力より大切です。


行動計画

何か他のことをする前に、いくつかの基礎スキルが必要です。


1.正しい態度を持つ

10年前に、データソフトウェアのコースの更新を数週間待たせることは受け入れられましたが、その時代はもう終わりました。現在、どこでも質のいいコースと資料があります。したがって、こつこつ勉強して、よく学んだスキルを練習しましょう。


2.言語を学び、数学力を向上させる

ほとんどの人はPythonおよび/またはRからデータサイエンスを始めたと思います。 CourseraやUdemyなどのサイトでは、数多くの無料のチュートリアルが提供されています。PythonユーザーはAnacondaとJupyterのノートブック、RユーザーはR Studioが好きです。数学力に関しては、Andrew Ngの機械学習コースとスタンフォード大学のニューラルネットワーク(neural network)コース、いずれも素晴らしく、勉強が楽しいです。


3.問題を解決する

ビジネスの専門家やデータエンジニアと協力して、仕事上の問題を解決してみてください。それは最善のエンドツーエンドの開発手法です。


4.Kaggleコンペに参加する

Kaggleのタスクが一定範囲に限られており、データも整っていますが、モデリングスキルを向上させるためには、数千人と一緒に挑戦的な問題を解くに越したことはないでしょう。コンペの結果を心配しないでください。そのコンペを練習場として、そこから進んてください。誰でもゼロっから始めます。是非試してみてね 。


5.データ専門家の動きに注目する

データ専門家は「データ分析業界のロックスター」と呼ばれまず。 Geoffrey Hinton、Andrew Ng、Yann LeCun、Rachel Thomas、Jeremy Howardなどの動きに関心を寄せてください。何かを学ぶことができるのではないかと思います。


「知らないと損をする「データ分析·サイエンス」サイト37選(ブログ&オンラインコース)」をぜひ参照してください。



6.効率よく仕事する方法を使う

基礎スキルを身につけてから、コードのデプロイおよび保守にGitHubなどのバージョン管理システムを利用してワークフローの改善を開始します。コンテナリゼーションについて、Dockerを利用てください。


7.効果的なコミュニケーションをとる

自分の成果をアピールすることも必要です。経営層は見た目のいいデモを好みがちなので、重要なプレゼンテーションで発表できる内容を準備しといてください。

1_OFisftMy6GegoqVHw2GMdA.jpeg


進路の準備

今勤める会社が適切なツールや環境を持っていないのであれば、世界中のあらゆるスキルを使うとしても、自分の力を発揮でません。 自分でコントロールできないものに囚われないで、コントロールできるものに集中しましょう。


1.自分に合った組織へ転職

それは最も簡単な解決策です。ほとんどの中規模と大規模の組織には、少なくとも1つの小規模なデータサイエンスチームがあります。入ってください。


2.正しい人と協力する

短時間で転職できない場合、知っている範囲で知識が一番豊富なデータサイエンティストと協力する機会を探しましょう。たとえば、問題解決を依頼するのではなく、自動化される可能性がある問題を特定し、専門家と協力するかどうかを検討します。


3.適切なツールと環境をサポートする

企業はデータサイエンスのツールを導入するかどうか、また導入の方法がわからないことが多いです。 企業は伝統的な分析プログラムに忙しくて、新しいデータ分析ツールの開発でセキュリティ監査が時間がかかるので、利益をもたらすビジネス計画にのみ興味を持っています。適切な環境、ツール、とトレーニングを導入できる機会を利用してくだい。


4.ユースケースを開発する

あなたの業務プロセスを見直して、データサイエンスをどのように運用できるかを考えてください。この2つを概念実証で関連付けます。それから、ツールや環境へのアクセスのために成功例を活用します。


5.才能のある人と仕事する

あなたが持っていないスキルを持って熟練した多様なチームの一員になりましょう。多くの目標に達成するだけではなく、知らないうちにほかの人の知識を学べることもできます。


最後に

今のようによい時はありません。今日こそ、勉強をはじめて、なるべく早く現実問題に着手してください。

歩んだ道を引き返すことはできません。少しずつ進んで、成果で自分を驚かせて、そのチャンスを楽しんでください。


以上は翻訳です。

【学習計画】十週間で知識ゼロからのデータ分析入門を更新しています。データ初心者の役に立つよう頑張って書いていきます。

ツイッターでデータ分析とデータサイエンスについての面白い情報をシェアしています。よかたっら覗いてください!:sparkles: