データサイエンスは、データ駆動型社会市場の台頭としてはもはや流行語ではありません。PWC(Price Waterhouse Coopers)によると、2015年から2018年までの間に「分析スキル」で5000万人を超える雇用が創出されています。IBMのレポートでは、2020年までにデータ関連の求人が270万人に達すると報告しています。機械学習やAIのようなデータ関連の専門的スキルは、分析職にとって欠かせないものです。
この記事では初心者、特にデータ分析の仕事をしたい人のためビッグデータ分析用オンライン講座10選を紹介します。
Coursera
1. Data Analysis and Presentation Skills: the PwC Approach Specialization
提供者:Price Waterhouse Coopers LLP
推奨学習時間:21週間、週3〜4時間
このコースは、データ駆動型の意思決定、Excelの基本機能利用による問題解決、Excel高級オプション利用によるデータの視覚化、PowerPointを使ったビジネス・プレゼンテーション、そしてデータ分析とプレゼン技術といった5つの内容を紹介します。 一般的な従業員向け、さらにプログラミングの経験がない人にも適する専門的なデータ分析スキルコースは、理論的な知識よりもビジネスアプリケーションに焦点を当てています。
2. Data Science Specialization
提供者:John Hopkins University
推奨学習時間:43週間、週4〜9時間
10コースを利用して、適切な質問をすることからデータをまとめて見える化することで結果を公表することまで、データサイエンスパイプライン全体で必要となる概念とツールを紹介します。
Courseraで最も長いデータサイエンス専門分野の1つで。前で紹介したPWCの口座とは異なり、統計学、アルゴリズムおよびデータ分析に関する理論により焦点を当てています。しかし、このコースはR言語に基づいて行われたので、コースを受講する前にプログラミングの基本的な知識を固めたほうがおすすめです。
提供者:University of California, San Diego
推奨学習時間:30週間、週3〜6時間
基本的な紹介、モデリング、管理システム、統合、処理から機械学習やグラフ分析まで6つのコースからビッグデータの主な側面をカバーしています。初心者ためのビッグデータ入門書でプログラミングについて深く掘り下げていないので、事前のプログラミング経験は必要ありません。
提供者: Duke University
推奨学習時間:27週間、週5〜7時間
Rでデータを分析および視覚化する方法を学ぶ5つのコースで紹介します。再現可能なデータ分析レポートを作成し、統計的推論の統一された性質を概念的に理解できます。R言語に関する知識が必要です。
EDX
5. Microsoft Professional Program in Data Science
提供者:Microsoft
推奨学習時間:56-58週間、週2〜4時間
3つのユニット(合計10コース)と1つのプロジェクトで構成されています。データサイエンスの基本的な紹介、重要なプログラミング言語、および応用データサイエンスにおける高度なプログラミング言語について説明します。Microsoftソフトウェアとの関連性が高く、例えばExcel、Power BI、Azure、Rサーバーなど、もちろんR言語とPythonも含みます。
提供者:University of California, Berkeley
推奨学習時間:16週間、週5〜7時間
このコースは、マーケティング測定戦略、価格と販売促進分析、競合分析と市場細分化、製品流通と販売を含む4つのコースに分かれています。Oracle、3Com、NASAなどの企業でマーケティングおよび製品開発において主導的な役割を果たしてきた業界専門家のステファン・ソルジャー(Stephan Sorger)によって設計および指導されています。
Cognitive Class
提供者:IBM
推奨学習時間:2週間、週5〜7時間
3つのコースから構成されて、ビッグデータ、Hadoop、およびSparkについて簡単に紹介します。Cognitive classはIBMが主導するビックデータに関するオンライン上の学習コミュニティです。
MIT Open Courseware
提供者:Prof. Erik Demaine
推奨学習時間:22セッション(90分/1セッション)
このコースは、時系列に沿って行われるストレージのように、幾何学的データ構造や時間的データ構造など、さまざまなタイプのデータ構造の概要を示します。そのような多様なデータ構造の主な研究方向をカバーしています。
9. Python
提供者:Austin Bingham, Robert Smallshire, Terry Toy, Bo Milanovich
推奨学習時間:7コース(約28時間)
このコースは、Python言語の基本からWebフレームワークおよびプログラミングの処理に至るまで紹介します。 Pythonは、汎用のプログラミング言語で、コードがシンプルで扱いやすく設計されており、C言語などに比べて、さまざまなプログラムを分かりやすく、少ないコード行数で書けるといった特徴があります。それはPythonがデータ分析で人気のあるプログラミング言語になる原因です。
Udemy
10. Java Tutorial for Complete Beginners
講師:John Purcell
推奨学習時間:75レクチャー(約28時間)
事前のプログラミング知識は必要なく、Javaプログラミング言語を学ぶための初心者コースです。HadoopはJavaベースであり、ビッグデータ分析の基盤を築く最もホットなオープンソースソフトウェアの1つです。
Octoparse
上記のコースにはデータ分析のさまざまな側面が含まれていますが、十分なデータを入手するという前提条件があります。オンラインでデータを手動で抽出する従来のアプローチは、もはや使用されていません。インターネット上の情報を抽出するには、はるかに効率的なWebスクレイピングツールが必要です。 Octoparseは、多くのデータ専門家によって推奨されている自動Webスクレイピングツールです。それは使いやすく、早く習得でき、事前のプログラミング知識を必要としません。 何百万というオンラインのデータが、数秒であなたの指先で構造化データシート(Excel、CSV、SQL、API)にインポートすることができます。
Octoparseを利用してスクレイピングする活用事例をOctoparseのホームページまでご参考いただきます。
あなたにとっての最大の課題は、コースがそれほど難しいことではなく、あなたのキャリアを次のレベルに引き上げることです。 一緒に頑張りましょう。