LoginSignup
3
1

データサイエンティストって 統計(57)

Last updated at Posted at 2020-01-06

経験上、Data scientist、AI技術者は十分市場に存在しています。

ちょうど、昔、プログラマが不足していると言っていた時と同じかもしれません。

にわかプログラマが沢山いたり、プログラマの素養のある人がプログラミングを仕事にせずに、個人的にプログラミングしていたりしていた。

Data Scientist、AI技術者も同様だと思う。

その背景を説明する。

プログラマは、何もないところに、プログラムを書かなくてはいけないかもしれない。

ちょうど、真っ白な画面に、筆を下ろして絵を描いていくように。

それに対して、Data scientistは、すでにデータがあることが前提となる。

場合によっては、必要なデータがどこにあるかわからず、山師が鉱山を探すように、膨大な市場からデータを探さなくてはいけないかもしれない。

探すのであって、造るわけではない。

市場誘導型の商品・サービスでは、真っ白な市場に、情報を提供して、データを創り出さないといけないかもしれない。

ここで、data scientistに3つの仕事の仕方があることがわかる。

  1. 存在するデータを分析する

  2. データを探して分析する

  3. データを生成して分析する

プログラマでも同様に3分類してみる。

  1. 既存のプログラムを改良する

  2. プログラムを探してきて改良する

  3. プログラムを生成・作成する

プログラムを探してくるのと、データを探してくるのの違いは、
データを探してくる作業は、データを分析する作業として実行できる点にある。

プログラムを探してくる作業も、プログラムを組んで実行できるかもしれず、
似た構造は存在するかもしれない。

市場を牽引するのは難しく、ここでの題材から一旦切り離す。

市場を牽引するためには、市場の分析がおおまかにはしてあって、
どこを切り口とするかを決めながら、札をだして反応を見ることになるかもしれない。

データ分析

data scientistに必要な技術はを20 16種類想定する。

1 統計(論理系、物理系、生命系、言語系、社会系)
2 確率(論理系、物理系、生命系、言語系、社会系)
3 誘導理論(論理系、物理系、生命系、言語系、社会系)
4 計算処理(論理系、物理系、生命系、言語系、社会系)

縦に4つはどこか網羅しているとよい。

統計が読めて、確率計算ができ、誘導理論をあてはめて、実際の計算処理をする。

Qiitaでdata scientistの初心者と言っている人のほとんどが、
縦に1度は経験している人ばかり。

大学の卒業研究で、理論系の方は、3だけ、2と3、3と4という感じで一部しか経験されていない可能性がある。
実験系の方は、1234のすべてを経験されている場合がある。
複数人で分担し、その一部しかやっていない方もおみえになるかもしれない。

それらをすべて集めると、医歯薬理工言語経済法律系の学科の3分の1の方はData scientistだと推測する。

それに比べて、プログラミングは、1だけ、2だけ、3だけ、4だけでも卒業できてしまうかもしれないくらいに、細分化している可能性がある。

大学の卒業研究修了時点で、プログラマは10分の1程度だというのが推測値です。

Data Scientistの方が、Programmerよりも3倍くらいは多い。

課題は、大学で扱えるデータの質に偏りがあるかもしれないという程度ではないだろうか。

対象領域では、疫学が最高峰にあたる。
根拠は、すべての対象領域を網羅していないと、疫学としての価値が下がるから。
ありとあらゆる方面から検討していると疫学として、説得力がある。

ありとあらゆる検討をしているという面からするとHAZOPという手法に馴染むかもしれない。

ワークショップ「ソフトウェア開発におけるHAZOP入門」の結果
https://qiita.com/kazuo_reve/items/c1c1d32baed5d60d55c7

効率的なHAZOPの進め方。仮説(187)
https://qiita.com/kaizen_nagoya/items/2b8eae196945b7976446

安全分析においてHAZOPで想定外を洗い出すために
https://qiita.com/kaizen_nagoya/items/11f1ace6f4c150248903

安全分析(HAZOP)の際の声かけ。安全(20)
https://qiita.com/kaizen_nagoya/items/381649a6ea025ecba173

図を使って分析すればこんなに簡単。安全(11)
https://qiita.com/kaizen_nagoya/items/6347eb55b2812d745549

ちょけねこ たんじょうびのおくりもの 
https://qiita.com/kaizen_nagoya/items/fc9675686c229f7a155e

プロのData Scientistというには

プロのData Scientistであるには、
顧客が欲しいデータ、顧客が探して欲しい方向性のうち、
市場で勝てる鍵を取り出せるかどうか。

何人かのプログラマが競争してプログラミングしている状況を想定しよう。
Data Scientistも何人かが市場で競争している。

他の人より早く、あるいは、より効果的に、あるいはより安価にデータを作りあげられるかどうか。

競争状態では一定の水準には意味がない。
相手に勝たないといけない。

場合によっては、市場を寡占する方法と、市場の二位をめざして利益率で一位になる方法や、費用対効果を満たし次の方向性に投資できればよいという方法もあるかもしれない。

勝ちか負けかとは限らない。
戦い方、戦う範囲、戦う期間は自分たちで選べるかもしれない。

それらのデータ分析の一部である。
課題は、顧客が満足して、次の依頼があるかどうか。

参考文献

データサイエンティストの気づき「勉強だけして仕事に役立てない人。大嫌い!」。『それ自分かも ? 』ってなった。
https://qiita.com/kaizen_nagoya/items/d85830d58d8dd7f71d07

データサイエンティストへの5つの門。あなたはいくつの門をくぐりましたか?統計と確率(8)
https://qiita.com/kaizen_nagoya/items/ee5fa7b2a7f7c2b450d4

データサイエンティストへの5つの門。データ部分。
https://qiita.com/kaizen_nagoya/items/f4740da340dcbd690789

Data ScientistのためのPython, R, Machine Learning/Deep Learning環境構築。docker(20)
https://qiita.com/kaizen_nagoya/items/ff16ce6f2a1af43c77f3

Data Scientist の基礎(1)データ構造
https://qiita.com/kaizen_nagoya/items/27d8f5db34ff747d587b

Data Scientist の基礎(2)参考文献
https://qiita.com/kaizen_nagoya/items/8b2f27353a9980bf445c

データサイエンティストのための分析:Qiita自己記事まとめ2020:Qiita(98) 統計と確率(23)
https://qiita.com/kaizen_nagoya/items/ff51b03848908d38d7b3

データサイエンティストのための分析:Qiita自己記事まとめ2020 (演習):Qiita(97)
https://qiita.com/kaizen_nagoya/items/31a7d9ad7dc514ad72cc

一覧

物理記事 上位100
https://qiita.com/kaizen_nagoya/items/66e90fe31fbe3facc6ff

量子(0) 計算機, 量子力学
https://qiita.com/kaizen_nagoya/items/1cd954cb0eed92879fd4

数学関連記事100
https://qiita.com/kaizen_nagoya/items/d8dadb49a6397e854c6d

統計(0)一覧
https://qiita.com/kaizen_nagoya/items/80d3b221807e53e88aba

言語・文学記事 100
https://qiita.com/kaizen_nagoya/items/42d58d5ef7fb53c407d6

医工連携関連記事一覧
https://qiita.com/kaizen_nagoya/items/6ab51c12ba51bc260a82

自動車 記事 100
https://qiita.com/kaizen_nagoya/items/f7f0b9ab36569ad409c5

通信記事100
https://qiita.com/kaizen_nagoya/items/1d67de5e1cd207b05ef7

日本語(0)一欄
https://qiita.com/kaizen_nagoya/items/7498dcfa3a9ba7fd1e68

英語(0) 一覧
https://qiita.com/kaizen_nagoya/items/680e3f5cbf9430486c7d

転職(0)一覧
https://qiita.com/kaizen_nagoya/items/f77520d378d33451d6fe

仮説(0)一覧
https://qiita.com/kaizen_nagoya/items/f000506fe1837b3590df

Qiita(0)Qiita関連記事一覧(自分)
https://qiita.com/kaizen_nagoya/items/58db5fbf036b28e9dfa6

鉄道(0)鉄道のシステム考察はてっちゃんがてつだってくれる
https://qiita.com/kaizen_nagoya/items/26bda595f341a27901a0

安全(0)安全工学シンポジウムに向けて: 21
https://qiita.com/kaizen_nagoya/items/c5d78f3def8195cb2409

一覧の一覧( The directory of directories of mine.) Qiita(100)
https://qiita.com/kaizen_nagoya/items/7eb0e006543886138f39

Ethernet 記事一覧 Ethernet(0)
https://qiita.com/kaizen_nagoya/items/88d35e99f74aefc98794

Wireshark 一覧 wireshark(0)、Ethernet(48)
https://qiita.com/kaizen_nagoya/items/fbed841f61875c4731d0

線網(Wi-Fi)空中線(antenna)(0) 記事一覧
https://qiita.com/kaizen_nagoya/items/5e5464ac2b24bd4cd001

OSEK OS設計の基礎 OSEK(100)
https://qiita.com/kaizen_nagoya/items/7528a22a14242d2d58a3

Error一覧 error(0)
https://qiita.com/kaizen_nagoya/items/48b6cbc8d68eae2c42b8

++ Support(0) 
https://qiita.com/kaizen_nagoya/items/8720d26f762369a80514

Coding(0) Rules, C, Secure, MISRA and so on
https://qiita.com/kaizen_nagoya/items/400725644a8a0e90fbb0

プログラマによる、プログラマのための、統計(0)と確率のプログラミングとその後
https://qiita.com/kaizen_nagoya/items/6e9897eb641268766909

官公庁・学校・公的団体(NPOを含む)システムの課題、官(0)
https://qiita.com/kaizen_nagoya/items/04ee6eaf7ec13d3af4c3

「はじめての」シリーズ  ベクタージャパン 
https://qiita.com/kaizen_nagoya/items/2e41634f6e21a3cf74eb

AUTOSAR(0)Qiita記事一覧, OSEK(75)
https://qiita.com/kaizen_nagoya/items/89c07961b59a8754c869

プログラマが知っていると良い「公序良俗」
https://qiita.com/kaizen_nagoya/items/9fe7c0dfac2fbd77a945

LaTeX(0) 一覧 
https://qiita.com/kaizen_nagoya/items/e3f7dafacab58c499792

自動制御、制御工学一覧(0)
https://qiita.com/kaizen_nagoya/items/7767a4e19a6ae1479e6b

Rust(0) 一覧 
https://qiita.com/kaizen_nagoya/items/5e8bb080ba6ca0281927

小川清最終講義、最終講義(再)計画, Ethernet(100) 英語(100) 安全(100)
https://qiita.com/kaizen_nagoya/items/e2df642e3951e35e6a53

<この記事は個人の過去の経験に基づく個人の感想です。現在所属する組織、業務とは関係がありません。>
This article is an individual impression based on the individual's experience. It has nothing to do with the organization or business to which I currently belong.

文書履歴

ver .0.01 初稿 20200106
ver. 0.02 言語系を加え、分類を16から20に。参考文献追記 202111127

最後までおよみいただきありがとう4ざいました。

いいね 💚、フォローをお願いします。

Thank you very much for reading to the last sentence.

Please press the like icon 💚 and follow me for your happy life.

3
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
1