3
6

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 3 years have passed since last update.

データサイエンスって?

Last updated at Posted at 2021-02-09

#目次
1.はじめに
2.データサイエンスとは
3.データサイエンティストとは
4.必要なスキル
5.参考文献

#1. はじめに
皆さん、こんにちは!まさや(@masa__ya8)です!
今回は__2020.12.01__に大学でデータサイエンスサークル(非公認)(@plot_niigata)を設立し、新歓に向けて記事を書きました。記事に関して間違っている点などありましたら、コメントなどで指摘していただけると嬉しいです!

#2. データサイエンスとは
データサイエンスとは、
####「データを活用して課題を解決すること」
です。

インターネットの普及やIT・科学技術の発達などにより、ビックデータと呼ばれる膨大なデータも効率よく扱えるようになったことで、近年その注目が高まっています。

データサイエンスの一連のプロセスとしては、

問題設定

データ収集

データ分析

モデル構築・精度検証精度向上の取り組み

課題解決

となります。

ビジネスはもちろん、医療や教育など様々な場面でデータサイエンスは多くの価値を生み出しています。

#3. データサイエンティストとは
データサイエンティストとは、データサイエンスを職業として扱う人のことです。
日本では不足しており、需要が高く、__魅力的な職業__と言われています。また、様々なスキルが求められ、統計学やAIに関するスキルが必要不可欠です。

「2.データサイエンスとは」で一連のプロセスを記載しましたが、実際に例を使って説明します。また、この例は「Python実践データ分析100本ノック」の第3,4,5章の内容を使用しています。
####「スポーツジムのデータ」
問題設定・・・退会してしまうのを防ぎたい!退会してしまう人はなぜ退会するのか?

データ収集・・・ジム利用履歴や会員データなどを使用する

データ分析・・・値がないデータ(欠損値)などを処理した後、顧客データの基礎集計や顧客行動の各種統計量を把握し、グラフや表にする(可視化)

モデル構築・精度検証精度向上の取り組み・・・決定木というアルゴリズムを用いて、退会予測モデルを作成する。精度向上の取り組みとして、ここではモデルのパラメーターをいじっている(木構造の深さを浅くしている)

課題解決・・・構築したモデルから、どのデータが重要かがわかる。また、データを入力するだけでどの顧客が退会するのかが予測できる

楽天→[こちら](https://books.rakuten.co.jp/rb/16017220/) amazon→[こちら](https://www.amazon.co.jp/Python%E5%AE%9F%E8%B7%B5%E3%83%87%E3%83%BC%E3%82%BF%E5%88%86%E6%9E%90100%E6%9C%AC%E3%83%8E%E3%83%83%E3%82%AF-%E4%B8%8B%E5%B1%B1%E8%BC%9D%E6%98%8C-ebook/dp/B07ZSGSN9S/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&crid=1BI5XFH44TJJ9&dchild=1&keywords=%E5%AE%9F%E8%B7%B5%E3%83%87%E3%83%BC%E3%82%BF%E5%88%86%E6%9E%90+100%E6%9C%AC%E3%83%8E%E3%83%83%E3%82%AF&qid=1611842746&sprefix=%E5%AE%9F%E8%B7%B5%E3%83%87%E3%83%BC%E3%82%BF%E5%88%86%E6%9E%90%2Caps%2C276&sr=8-1)

#4. 必要なスキル
以下は、一般社団法人データサイエンティスト協会が公開している情報をもとに作成した3つのスキルセットです。
スライド1.jpeg

##データサイエンス

  • データを最適な形式で集計、可視化

  • 分析結果を正しく読み取る力

  • 機械学習や統計モデルの知識・スキル

など

##データエンジニアリング

  • 機械学習などの高度なアルゴリズムの開発・実装

  • データ加工

  • プログラミング(Python, R, SQLなど)

など

##ビジネス力

  • 課題抽出・企画提案

  • プレゼンテーション

  • コミュニケーション

など

下記の情報をもとに作成しました。詳しくはこちらをご参照ください。
AI drops -未来につながるAIメディア-
一般社団法人データサイエンティスト協会 スキルチェックリスト(PDF)

#5. 参考文献
この記事は以下の情報を参考にして執筆しました。

3
6
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
6

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?