Google データアナリティクス プロフェッショナル認定証とは
コースの概要
Google社が提供するデータアナリティクスのオンライン講座のことです。Couseraにて有償で提供されており、昨年の8月に先着6000名を対象に無償提供されたことで一時期話題になりました。このときはわずか1日か2日で6000名の枠が埋まってしまうほどの人気ぶりでした。私は9月末にお金を支払って登録しましたが、11月頃にも再度6000名の枠の無償提供があり、そのタイミングから私も無償で利用しました。
同講座は専門的な知識がない方も対象としたエントリーレベルですが、データアナリティクス職に必要な最低限の知識を網羅した内容となっています。想定所要時間は約180時間とのことです。
米国で行ったアンケートによると、認定資格取得者の75%が、認定資格修了後6か月以内にキャリアが向上したそうです。またGoogleの求人では大卒同等の資格として扱うとのことです。Couseraは月額5500円ほどなので、約2~3万円で大卒資格が取得できるとしたら魅力的です。
認定証を取得しました
9月末から2月初めにかけての約4カ月、合計101時間かけて認定証を取得しました。
取得した理由としては、昨今リスキリングが話題になっていることもあり、新たなスキルとしてデータサイエンスに興味があったためです。
また、本コースを終了したことをビジネスSNSのLinkedInに実績として示せます。どのくらい評価されるかは未知数ですが、IT関連の資格以外にも自分の実績が増やせるといいなと感じました。
学習する内容
コース一覧
本コースは以下の8つで構成されています。各コースは4~5週間かけて学ぶ設定になっています。
- 基礎知識:データはあらゆるところにある
- データに基づいた意思決定を行うための問いかけ
- 探索用データを準備する
- 「ダーティー」なデータを「クリーン」にする
- データを分析し、答えを導き出す
- データ可視化(ビジュアライゼーション)による、データの共有
- データ分析とR 言語
- 学びの総仕上げとしての最終課題:ケーススタディ
コース1ではデータアナリティクスの業務に関する基礎知識を学びます。データアナリティクスの業務は「問いかけ、準備、処理、分析、共有、行動」の6フェーズに分かれるのですが、コース2から6では各フェーズの内容を学びます。コース7ではプログラミング言語のRを用いたデータ処理や分析、可視化の手法を学びます。最後のコース8ではここまでの知識を活かしてケーススタディに取り組みます。
使用するツール
いずれも無償版を利用します。本コースに登録したからといって、特別なツールが使えるわけではありません。
・Google スプレッドシート
⇒表計算シートを用いた分析、可視化に利用
・Google BigQuery
⇒オープンデータの活用、SQLを用いた分析、可視化に利用
・Tableau Public
⇒データのビジュアライゼーションに利用
・RStudio
⇒Rを用いた分析、可視化、レポート作成に利用
コンテンツの形式
各コースの内容は以下のようなコンテンツで構成され、飽きが来ないように工夫されています。
【動画】
新しい内容について学ぶとき、Google社員が講師として動画に登場して解説してくれます。講師は1人ではなく、コースごとに別々となっています。講師とは別の社員が登場し、自らが行なっているデータ分析の業務を語ってくれることもあります。退役軍人の社員も登場するのは外資系企業だなと感じました。
【テキスト教材】
動画で解説した内容をテキストで詳しく紹介しています。より詳細な内容を解説するWebページへのURLを示してくれる場合もあります(大半は英語のページ)。簡単な質問に文章で答えることもありますが、実際に採点してくれるわけではなく、何かしらコメントを書けば合格扱いになります。
【ディスカッション】
学習した内容に関するお題が出され、Cousera上のフォーラムに投稿します。他の人の回答に対してコメントすることもできます。参加はオプションなので飛ばしても修了証の取得には影響ありません。私の場合、何故か文章を書いても上手く表示されなかったので基本飛ばしてしまいました。
【練習問題】
コースで学んだ内容について4択などの選択肢問題が出題されます。80%以上の点数を取れなければやり直しになります。基本的に難しい内容ではなく、ほとんどは1回目か2回目の試験で合格しました。間違えた問題に対して参考ページのURLリンクが表示されるのですが、リンク先を見てもどこが該当するのかよく分からないというのが多々ありました…
【コースチャレンジ】
各コースの一番最後にコースチャレンジというテストが設けられています。データアナリストとして業務に携わるようなケースを想定した問題が出題されます。練習問題より少し難易度は高く、コースによってはSQLやRのコードを書いてデータ分析もしますが、基本は練習問題と同じく選択肢問題です。
各コースの内容
ここからは各コースの内容について、私の感想も交えながらざっくり紹介します。有償の内容なので詳細には触れないようにしました。
各コースについて、修了までにかかる想定時間が公開されています。想定時間と私が実際にかかった時間も紹介します。
8コース全体では以下の所要時間となり、想定時間の約6割で修了しました。
【所要時間(全体)】
想定:177時間
実際:101時間
1. 基礎知識:データはあらゆるところにある
【所要時間】
想定:18時間
実際:10.7時間
コースの初回ということで、データアナリティクスに関連する概念やデータの活用方法などの基礎知識を学ぶコースです。
データ分析の一連のプロセスである「問いかけ、準備、処理、分析、共有、行動」の6つの概要、データアナリストに必要なスキルやツール、データを活用したビジネスの事例といった内容を含みます。
導入として、これから何を学んでいくのか一通り見せてくれるような内容です。私自身、特に引っかかることもなく完了しました。
2. データに基づいた意思決定を行うための問いかけ
【所要時間】
想定:19時間
実際:10.5時間
データ分析の最初のプロセスである「問いかけ」に関する内容です。
ビジネスの場面でどのような課題に直面するのか、課題を解決するにはどのような問いかけをするのか、問いかけを検討するためのフレームワーク、ステークホルダーとのコミュニケーションなどを学びます。
定量データと定性データの違い、ダッシュボードの種類といったデータの扱い方に関する内容も登場します。
また分析ツールの一つとしてGoogleスプレッドシートの使い方の解説も始まります。2回目のコースだけでなく、この後のコースでも解説を加えながら徐々に知識を深めていく形式です。
とは言っても、そこまで難しい内容ではありません。私自身は業務でもプライベートでもExcelを使うことが多く、Googleスプレッドシートはほぼ使ったことがありませんでした。
Excelでできる内容と同じこと(関数や条件付き書式など)は大体できますし、入力補完機能はExcelより優秀かなと感じました。ただ普段使い慣れているぶん、今後もExcelを使い続けることになりそうです。
3. 探索用データを準備する
【所要時間】
想定:23時間
実際:12.5時間
データ分析の2つ目のプロセス「準備」に関する内容です。
データの収集先やデータ形式、構造化データと非構造化データの違い、データに関するバイアス、データ倫理やプライバシー、メタデータなどを学びます。
コース3からはGoogle BigQueryを用いた分析に関する内容も登場します。BigQueryで公開されているオープンデータの活用方法や、SQLによる分析などを行います。
コース中ではBigQueryの一般公開データセットを用いて分析するよう指示があるのですが、指示通りに行ってもデータセットが追加できないという問題に直面しました。
Couseraのフォーラムを確認したところ、同じような問題に直面している人の書き込みがあり、その通りにすると解決しました。
困ったときにフォーラムが活用できるというのはCousera上のオンラインコースである利点といえるでしょう。ただ全くの初心者であれば脱落しやすいポイントかと思います。
他にもKaggleの使い方や、LinkedInやGitHubなどオンラインで存在感を高めることの重要性に関する内容も出てきます。
4. 「ダーティー」なデータを「クリーン」にする
【所要時間】
想定:22時間
実際:12.2時間
データ分析の3つ目のプロセス「処理」に関する内容です。
データと目的の整合性、データに問題がある場合の対処法、サンプルサイズの考え方、完全性が失われたダーティデータの問題点などが取り上げられています。
GoogleスプレッドシートやSQLを用いたデータクリーニングの方法も手を動かしながら学びます。例えば、以下はデータをグラフ化したことで極端に小さい異常値があると分かります。
次に示す例では、SQLを用いたクリーニングとして顧客リストの名前の誤りを修正しています。
データアナリストへの就職に活用するためのレジュメ作成に関する内容も登場します。求人サイトなどで実際のレジュメを参考にしたり、自分の過去の経験を棚卸したりといった内容です。
5. データを分析し、答えを導き出す
【所要時間】
想定:26時間
実際:15.8時間
データ分析の4つ目のプロセス「分析」に関する内容です。
GoogleスプレッドシートとSQLについて、さまざまな機能や構文を学びながらより深くデータを分析していきます。
データの並び替えやフィルタリング、データフォーマット、複数データの結合、データ集計といった内容です。
GoogleスプレッドシートならVLOOKUPなどのさまざまな関数や条件付き書式、ピボットテーブルなど。SQLなら文字列操作やJOINによる集計、サブクエリ、一時テーブルの使用などが登場します。
以下は映画に関するデータセットを用いて、ジャンルごとの平均収益をグラフ化しています。
分からないことがあったとき、質問サイトのStack Overflowでサポートしてもらう方法の解説もあります。
6. データ可視化(ビジュアライゼーション)による、データの共有
【所要時間】
想定:24時間
実際:14.4時間
データ分析の5つ目のプロセス「共有」に関する内容です。
データを可視化してストーリーを伝えることの重要性が語られます。データおよびビジュアルで何を語るか、誤解を招くグラフを避けるにはどうするか、美しいビジュアライゼーションの例などを学びます。
データビジュアライゼーションのツールとして、無償利用可能なTableau Publicを活用します。TableauはBI(ビジネスインテリジェンス)ツールの中でも、綺麗なビジュアルのダッシュボードを作成できるという特徴があります。私自身もTableauを使ってみたいと以前から感じていたので、この機会に触れるのを楽しみにしていました。
しかし、ここで再度引っかかったポイントがあります。Tableau Publicでダッシュボードを作成したあと保存しようとすると、何故かサーバーエラーになって保存できませんでした。
この問題について調べたところ、Tableauの公式サイトのフォーラムで同様の質問を見つけました。しかし、開発者も認識はしているが現在解決できていないそうです。
大きくモチベーションダウンしていたのですが、Tableauのデスクトップ版であるTableau Public Desktop Editionを利用すると無事保存できることが分かりました。
ほかにはプレゼンテーション技法に関する内容もあります。プレゼンテーションの流れやスライドの作成、質疑応答の対応の仕方が学べます。
7. データ分析とR言語
【所要時間】
想定:37時間
実際:19.4時間
統計分析を得意とするプログラミング言語であるRを用いると、ツールの制約を受けずにデータが扱えるようになります。Rを用いたデータの分析やビジュアライゼーション、レポート作成といった内容を学びます。
使用するツールはクラウドベースの統合開発環境であるRStudio Cloudです。R関連のパッケージをインストールするとさまざまな分析ができるようになり、実際に手を動かしながら使い方を学習できます。
またR Markdownを用いて分析結果のレポートを作成できるのは、内容の修正も楽になるので面白い機能だなと感じました。
全8回のコースの中でも、このコースは所要時間が一番長くなります。これまでのコースと比べても、Rのコースは思った以上に時間がかかってしまいました。
それでも指示通りにコードを書いていれば基本的に詰まることはないため、ちゃんと取り組めば終えられるでしょう。
8. 学びの総仕上げとしての最終課題:ケーススタディ
【所要時間】
想定:8時間
実際:5.5時間
最後に、これまで学んだ内容の総仕上げを行います。
ポートフォリオの取り組み方は大きく分けて2つ。1つは与えられたデータセットを使って質問の流れに沿ってまとめるというもの。もう1つは自分の興味のある分野について自由にまとめるというものです。
データ分析の一連のプロセスである「問いかけ、準備、処理、分析、共有、行動」の流れに従い、これまで学んだことを振り返りながら取り組みます。
私は最初自由にまとめる方式で取り組みましたが、自分の欲しいデータが見つからないという問題に直面してしまいました。結局は方針を見直し、与えられたデータセットで分析した結果をまとめることにしました。
作成したポートフォリオはKaggleやGitHub、個人ブログなどで公開することを推奨されますが、私は公開していません。フォーラムで他の人のコメントを読む限り、公開している方は少なそうです。
自分の作成したポートフォリオに対して何かフィードバックが貰えるわけではなく、Kaggleなどを見るとレベルの高い分析を公開している方が多くいるので、公開するのに躊躇してしまうのです。
ポートフォリオを作成した後は、データアナリストとしての就職面接や契約交渉の方法について学習します。就職面接については、正直そこまで目新しい内容には感じませんでした。一方で契約交渉については、これまでの人生で縁が無かったこともあり興味深かったです。
全体を振り返って
最後に全8コースを振り返って良かったこと、悪かったことをまとめます。
良かったこと
・月額5500円と安く、Googleのオンラインコースというネームバリューもある。取得後はLinkedInにデジタルバッジを追加できる。
・データアナリティクスの業務の内容全般について学ぶことができ、動画やテキスト、練習問題などコンテンツも豊富で飽きにくい。
・Googleの社員が講師として登場し、講師以外にもGoogle社員の仕事の取り組み方の話が聞ける。
・さまざまなオンラインツールを活用し、いずれも無償なので今後も自主学習を続けてやすい。
悪かったこと
・エントリーレベルということもあり、全体的に内容は簡単に感じた。プロを目指すなら更なる学習が必要。
・分析した内容に対してフィードバックが欲しかった。ただ月額5500円のオンラインコースと考えれば、そこまで手厚くできないのは仕方ないとは思う。
・この本文中でも紹介したが、指示通りに作業しても上手くいかない箇所があった。自己解決するのも勉強のうち?
感想
100時間以上かけて認定証取得まで達成でき、一安心しました。コースの前半は有償、後半は無償で利用するという形になりましたが、有償の期間のほうが勉強に対する意欲は高かったです。無償だと今月までに終わらなきゃというプレッシャーが無くなるので、ダラダラやってしまいました。
データアナリティクスの知識が身についたかというと、このコースだけで得られるのはあくまでも基礎知識だと思います。並行して別の勉強もしていましたが、知識不足を感じる場面が多々ありました。
しかしデータアナリティクスを学習するきっかけとしては優れた教材だと思います。データ分析の一連のプロセスを経験し、さまざまなツールの使い方を学んだことで今後の学習の目標が立てやすくなりました。
月額5500円という価格設定は素晴らしいです。データ分析に関するスクールなどは色々ありますが、金額が数十万円単位だったりして、内容も分からないのに払うのは気が進みませんでした。本コースは課題に対するフィードバックはありませんし、就職先を紹介してくれるわけでもありませんが、コストパフォーマンスとしては満足しています。
データアナリティクスやデータサイエンスに興味があるという方にはおすすめな教材です。昨年に無償アカウントを取得したのに放置しているという方も、再挑戦してみてはいかがでしょうか。