#The Netflix Data Scientist Interview Questions
Netflixのデータサイエンティスト採用時の面接に関する記事を見つけたので、ざっくり和訳と所感を。。
#Netflixでのデータサイエンティスト仕事
いろんなチームにデータサイエンティストがおり、それぞれの部門で仕事をしており、ディープラーニング、機械学習、統計モデル等を用いて、各チームのミッション(おすすめする映画やドラマの精度向上などなど)に取り組んでいるそう。
まぁ、これは想定できますし、どこの企業でも似たような感じかもしれないですね。
データサイエンス部みたいな部署があり、そこにデータサイエンティストが集まっている会社も多いかもしれませんが。
#求められるスキル
これ気になりますね。日本と違いがあるのか、そうでもないのか。。。
・統計学や経済学等の修士号、博士号
・大量のデータを用いて商品を革新させた実績を伴う、関連領域での5年以上の実務経験
・SparkやSQL、Python、Rを用いた経験
・実際に機械学習で成果を上げた実績
・観測データやABテストの領域で活用される深い統計知識
・TableauやR Shinyを用いてダッシュボードの構築経験
実績をかなり求めていますね。おそらく書類が通って面接では根掘り葉掘り聞かれるのでしょう。どんなデータで、どんな手法で、どんな実績をあげたのかを。(というか、書類でそこをアピールしないと通らないかもしれないですね)
また、NetflixはABテストをすごく多用する会社のイメージが有り、その知識も学んだほうが良いですね。テスト設計の知識を。単純にランダムで良いのか。サンプルバイアスの除き方なり。
#具体的にどんな仕事をNetflixのデータサイエンティストはしてるの?
プラットホームビジネスなので、内部のいろんなところで活躍してると想像できますが、具体例としては下記のような感じ。。。
・個人最適化
製品チームやエンジニアチームと協力して、映画やドラマのおすすめアルゴリズムの改善
・UIの改善
機械学習を用いたUIの改善
・製品開発
会員の動きや動画コンテンツのパフォーマンスからビジネスインサイトを得るための、フレームワークや視覚化ツールを開発し、他チームへ提供
・会員獲得
新規会員登録のためのデータセットの作成
・マーケティング
非技術チームでも使える、直感的なデータ活用ツールの開発
直接自分たちがビジネスを改善するタスク(おすすめアルゴリズムの改善など)もあれば、知識のない人間でもデータを活用できるようなツールの開発も行っているんですね。社内ツールによって、統計的知識がないチームでもデータをミスなくビジネスに活用できる、っていうのは大事ですね、作る側は大変そうですが。。。
#面接の流れ
大きく3ステップのようです。電話での採用リクルーター/採用マネージャ面接 → 電話での技術面接 → 対面でのチーム面接
・電話での採用リクルーター面接
30分ほどの電話面談では下記を主にチェックされるそうです
-書類に書いてある経歴をよく理解し、ポジションにマッチするか
-コミュニケーション能力(一般的な受け答えがちゃんとできるか、経歴とかちゃんと説明できるか)
・電話での採用マネージャ面接
ここでは技術的な質問が出てくるそうです
-なぜ、過去のそのプロジェクトではそのアルゴリズムを用いたのですか?
-機械学習アルゴリズムや分析手法を開発した方法を教えて下さい
など。これらを通して、応募者のレベル感を把握し、チームにマッチするか(技術的な意味で)をチェックするそうです。
日本だと、採用担当者からこのレベルまで聞く企業は少ないかもしれませんね。。。(転職したのが数年前なので最近の事情はわかりませんが。。。)
上記を通過すると次は技術面接になります。
・電話での技術面接
名前の通り、技術的な質問が45分ほどあるそうです。SQLなり、実験計画なり、機械学習なり、、
-ABテストに関してご存知のことをお話ください。
-L1正則化、L2正則化のちがいは?また、0.5正則化が一般的に用いられない理由は?
-オンライン勾配投下法とバッチ勾配投下法の違いは?
-利害関係者に機械学習の結果を報告する、一番良い方法は?
「理屈は知らんが、コードは書ける」ってタイプだとここで落ちそうですね。。
・対面でのチーム面接
上記を通過すると対面面接に呼ばれ、ランチを挟んで2回行われるそうです。
実際のデータサイエンスチームや製品マネージャー等の6~7人と、分析コンセプトや手法、製品に関してなど多様な範囲のディスカッションになるそうです。おそらく実務に近い形で「候補者が現場でworkするのかチェックされる」のでしょう。
ABテストや、仮設検証、Pythonのコード、SQLのコード、実験計画なり、いままでの面接で聞かれてきたことを現場で活かせる人なのか(知識だけで頭でっかちになり、実務では活躍できない人もいますからね)、また、企業カルチャーにフィットする人なのか、みられるのでしょう。
誤訳あるかもしれませんが、ざっくりこんなことが書かれてました。
個人的な一番の感想は、「うちでもこのフロー導入してくれないかな(現場離れた部長職以上の人が面接で採用した人間は使えないこと多すぎて迷惑なんだよ!!知識だけでコードかけなかったり、本に書いてあるきれいなデータしか触れたことなくて、実ビジネスのデータじゃ思考停止したり、知識のない部署や顧客への説明が下手くそすぎてクレームきたり。)」です。笑
##はてなブログも書いてます
良ければこちらも見ていただけると喜びます。
ゆくゆくはコード以外の雑多なことははてなブログに記載しようかな思ってます。
https://data-analy.hatenablog.com/
##ストアカで先生はじめました
データ分析初心者向けに、ストアカというサービスを利用して「ざっくりわかるデータサイエンス」という講座を解説しました!
極力数式は使わず、「ざっくり」と理解することを目的とした初学者向けの講座です。
良ければぜひ受講ください!
https://www.street-academy.com/myclass/75133
https://www.street-academy.com/myclass/73308