LoginSignup
4
6

More than 3 years have passed since last update.

データサイエンティストの仕事の実際について

Last updated at Posted at 2021-05-05

データサイエンティストの仕事の実際について.
データサイエンティストとして働くことについての真実についての日本語記事です.

本文

まず、データサイエンティストとして行っている仕事が本当に好きだということから始めましょう。私は、データサイエンティストとして人々や企業に大きな影響を与えうる興味深い問題に取り組んでいます。
しかし、それがすべてではありません。21世紀で最もセクシーな仕事と呼ばれた後データサイエンスになって、その後この分野に幻滅する人はかなりいます。
この記事では、私は、データ・サイエンティストとして勤務の長所と短所を紹介します。うまくいけば、どのような職種であるかよく理解できるようになるでしょう。
ここに記載されている短所や長所は、あなたにとっては異なる可能性があることに注意してください。これは一般的なことのリストとしてのみ機能します。
私は悲観論者なので、短所から始めましょう😅

短所

いくつかの短所は、私がそれらをここで声をあげるほど悪くはないかもしれません。たとえば、わたしはデータをクリーンアップすることを楽しんでいます。これにより、自分が何を扱っているかをよく理解できるようになります。ただし、幻滅を防ぐためにも明らかな不利な点を知っていることが重要だと思います。

1.データの取得

実際には、データサイエンティストは、データエンジニアの役割を担うことがよくあります。その重要な側面の1つは、分析/モデルの実行に必要なデータを収集することです。
このプロセスは、データに対して大規模なパイプラインを設定するか、関係者との調整や話し合いなどのロビー活動を行う必要があるため、非常に面倒な場合があります。

ロビー活動は仕事の一部になる可能性があります

パイプラインの設定は興味深い技術的な課題ですが、通常、データサイエンティストが求める課題ではありません。さらに、組織によっては、ロビー活動も含めて日常業務の大きな部分を占める可能性があります。

2.データは非常に乱雑であることがよくあります

データクリーニングは、データサイエンスにおいて非常に過小評価されている部分です。どんな最先端モデルでも使用するのは自由ですが、それは常にガベージイン=ガベージアウトになります。
多くの専門家は、あなたの仕事の少なくとも80%がデータクリーニングになると報告しています。これは、仕事のほとんどが興味深い分析だと考えている人を追いやってしまうかもしれません。

産業データは多くの場合,機械学習で使うにはあまりにも汚れています

乱雑なデータは常に修正できるとは限りません。私は、機械学習がまったく役に立たないデータセットに遭遇したことがあります。そのデータからどのような洞察を収集できるかを尋ねられたとき、私は「より多くのデータを取得する」または「より良いデータを取得する」のいずれかと答えました。

3.ビジネスの関与

データサイエンティストとして働く上でほとんど無視されている要素の1つは、ビジネスの関与です。あなたの仕事の大部分はおそらくビジネスになるでしょう。これは、利害関係者やクライアントの管理からデータのロビー活動まで多岐にわたります。大きな問題を魔法のように解決することが期待されることが多いことも取り組みを難しくします.

ダッシュボードにかなりの時間を費やすことを想定してください

ビジネス上は実施したことをAIによるものだと呼びたいと思うかもしれませんが、実際には、機械学習のユースケースはほとんどありません。これは多くの場合、データサイエンスではなく、ビジネス分析とダッシュボードに取り組むことを意味します。

4.ゲートキーピング

AIの分野での就職はここ数年でますます困難になっています。10年前ならデータ分析のいくつかのコースを受講すれば転職の準備になりましたが、現在は、博士号、FAANGでの10年の経験、アクティブなGithubポートフォリオなどが期待されています。

最近の卒業生は、データサイエンティストとしての仕事を見つけるのに苦労しています

データサイエンティスト、またはその問題のアナリストとしての仕事を得るのは、意欲的なデータサイエンティストにとって困難です。最近卒業したデータサイエンティストの大規模な流入は、この状況を助けません。

5.生涯学習

生涯学習は面白そうに聞こえますが、燃え尽き症候群などの原因となる可能性があります。AIの分野は急速に変化しているため、最新の研究について最新の情報を入手し、暇なときに絶えず成長することが期待されるかもしれません。

現場で最新の状態にすることはほぼ不可能です
この絶え間ない開発の必要性は、ワークライフバランスの妨げになる可能性があります。これは、多くの人の何かを逃しているという感覚を刺激し、Imposer syndromeにかかりやすくします。
※:自分のスキルに自身がなくなり,いつかそれがバレてしまうのではないかと怖くなってしまうこと

長所

これらすべての短所にもかかわらず、データサイエンスとAIが話題になっている理由はまだあります。多くの産業に革命を起こす可能性を秘めた驚くほど興味深い分野なのです.

それでは、いくつかの長所を見ていきましょう。

1.まだ新しい分野です

データサイエンスはここ数年誇大宣伝されてきましたが、多くの組織ではまだ成熟していません。この現象により、データサイエンティストは、チームの設立であろうと、新しいユースケースの解決であろうと、その分野で最初になることができます。

新しい問題を解決するための多くの機会

これらの機会はあなたが不可欠な従業員になることを可能にします。PoCの実践や新しい手法を試すことができます。

2.影響

データサイエンスのインパクトは非常に大きくなる可能性があります。特にそれが適切に使用されている場合、それは組織の基礎になる可能性があります。ダッシュボードのような一見基本的なものでさえ、マネージャやプロダクトオーナの製品への見方変える可能性があります。

ビジネスへの効果は大きくなる可能性があります

取り組む課題の調査に十分な時間を費やすとビジネスへの効果を大きくすることはできませんが,データサイエンティストは組織にとって重要な従業員になることができます。

3.機会

データサイエンティストの役割は、過去数年間で変化しました。研究者として働く人もいれば、データ分析に重点を置く人もいます。この不一致により、率先して業務を行う人は多くの役割を試すことができます。データサイエンティストがデータエンジニアやプロダクトオーナーの仕事をすることも珍しくありません。

データサイエンティストの役割には大きな柔軟性があります

ある時点で、個人の貢献者としてよりもビジネスに集中したい場合は、データサイエンティストとしてよりビジネス指向の役割に移行する可能性が非常に高くなります。

リソース

最後に、この驚くべき分野で始めるのに役立つ可能性のある追加のリソースをいくつか示します。

感想

データエンジニアリングに時間がかかるというのはよく言いますが,関係者との話し合いや調整などのロビー活動に時間を取られるというのはリアルな話だと思いました.データを渡してもらってそれで分析する人などほとんどいないのかもしれません.そうしているとスキルも陳腐化していくようで怖いのですけどね..

技術の進展が早いので燃え尽き症候群になりやすいと記事の中に言及がありましたがこれもわかる話です.もはやPythonの使いやすいラブラりはおろかGUIで簡単に分析できる環境が整っている今データサイエンスの分析技術はかなりコモディティ化していると感じます.データエンジニアと融合していくのはもちろん,コンサルティングやプロダクトオーナとしての役割が大きくなっていくのかもしれません.まぁWeb業界とかも技術の進展早いですが..

元記事

4
6
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4
6