はじめに
こんにちは。(株) 日立製作所の Lumada Data Science Lab. の文景厚(むん)です。
みなさまは「データサイエンティスト」が企業の中でどんな仕事をしているのかご存じですか?日立にはさまざまな分野で活躍するデータサイエンティストがたくさんいます。この記事では、私が一緒に仕事をしているメンバーの紹介を通して、データサイエンティストの具体的な業務を深堀りします。また、データサイエンティストとしてのキャリアパスも紹介します。
隠岐 加奈さん
今回紹介するのは、(株) 日立製作所 Lumada Data Science Lab.の隠岐 加奈さんです。
隠岐さんのインタビュー記事は以下の日立 Lumada Data Science Lab. 紹介サイトにも掲載されております。ぜひご覧ください!
Lumada Data Science Lab.のメンバーインタビュー
💡プロフィール
-
データサイエンティストになる前は、通信キャリア向けの通信装置の設計に従事していました。
-
現在はデータサイエンティストとしてLumada Data Science Lab.に所属し、データ分析やソリューションの開発などに取り組んでいます。
データサイエンティストとしての業務内容はもちろんの事、課題解決に向けて、どのようなアプローチ方法をとられているのかなどのお話しを聞きました。
――データサイエンティストになったきっかけを教えてください
-
入社した当初は、通信キャリア向けの通信装置に使われるFPGA(Field Programmable Gate Array)という電子回路の設計職をしていました。FPGAは書き換え可能な回路で、そこに書き込む回路をハードウェア記述言語でコーディングし、それをFPGAに取り込むという事をしていました。また、回路設計に関連したハードウェア設計の効率化にも取り組んでいました。
プロセスとしては、システム設計を取りまとめている部署からの依頼を受けて、コーディングしたあと、動作検証を実施し、実装(回路への書き込み)を行います。私は、コーディングと動作検証を主に実施していました。
-
日立の事業がモノを売っていくことからソリューションやそれを通じた価値の提供に代わっていく中で、私の所属していた部署でも設計・生産効率化をメインで行うようになりました。その中でデータ分析を行っているうちに、データサイエンティストと呼ばれる職種になっていました。
――今取り組んでいる課題はどのようなものですか?
設備・機械の保守運用効率化について取り組んでいます。
――課題解決にむけたアプローチとしてどのような方法をとられていますか?
現在、私が関わっている案件は以下の2つです。
-
ナレッジベース保守
⽇⽴では、保守マニュアルや保守履歴、設計データなどの知識を統合し、それらを設備の保守運⽤に活⽤する技術を研究しています。私が取り組んでいるのは、その研究をソリューション化して事業に活かすことです。従来から⽇⽴グループで展開している設備保守ソリューションをより強固にするための、拡張機能の設計を⾏っています。お客さまの保守業務の効率化、熟練者の知識の共有、蓄えた知識の活⽤を⽬指しています。これまでに、適⽤検証のための要件定義(業務フロー、データフロー、データモデル、システムフロー等)および、デモ開発を実施してきました。
-
ダメージ基準生存解析
機器への負荷データから機器寿命をモデリングする技術を⽤いて、保守基準の設定や保守計画⽴案といったメンテナンスの⾼度化を⾏うソリューションの開発を進めています。ダメージ基準⽣存解析というのは、機械にどの程度の負荷が与えられたのかを表すデータを基に、その機械の寿命を説明するモデルを構築する技術です。椅⼦を例にとると、何回座る(負荷をかける)ことによって、椅⼦がいつごろ壊れそうかを予測します。椅子の例は単純な場合ですが、対象機器が複雑な機械システムの構成要素である場合や、故障と負荷の関係が明らかでない場合もあります。そのような場合でも、ダメージ基準生存解析は計測データから適切なダメージを推定できるという特徴があります。
ダメージ基準生存解析の一例:
業務としては、技術の適⽤検証や、一定のスキルを持ったデータサイエンティストであれば技術を活用できるように、分析⼿順の標準化などを⾏っています。
――具体的な解析手順を教えてください
お客さまの課題解決に必要なソリューションは、「①課題分析」、「②データ分析」、「③システム検討」、「④開発」と4つのフェーズを設けて開発を進めます。私は「①課題分析〜③システム検討」の部分を主に担当しています。
①課題分析では、お客さまのビジネス上の課題と、課題を解決するための実行手段としてどのようなソリューションが必要なのかを確認します。併せて、機械の特徴、故障発生のメカニズム、運用方法や利用可能なデータなどについてもヒアリング調査を行います。
②データ分析では、利用可能なデータを収集し前処理を実施。そのデータを使ってモデリングを行い必要な精度が出せるかどうか試行錯誤していきます。「この種類の故障は予測できそうだけど、こちらは難しい」と試行錯誤しながら、どのように精度を改善していけば良いかをチーム内やお客さまと議論していくことになります。場合によっては別種類のデータを追加するなどしながら、最終的なモデルを構築していきます。
「③システム検討」では、データ分析結果を元に、お客さまの業務フローに照らし合わせたシステムの要件を洗い出します。そして最後に「④開発」フェーズに移ります。
――作業の進め方について教えてください。チームで作業されるのでしょうか?それとも完全に個人での作業ですか?
チームで方針を決めて、その後データ分析や資料作成などの個⼈作業を⾏っています。
入社してからも上司がアウトプットに対しては丁寧なフィードバックをくれたり、どう進めればよいか悩んでいるときは一緒に考えてくれる環境があります。上司や同僚と色々相談できる環境はありがたいですね。2020年からはコロナの影響で在宅勤務になりましたが、日々の連絡はチャットを活用したり、電話会議で定期的な打合せを行ったりと、作業を進めるに当たってのコミュニケーションは問題なく取れていると思います。
――お客さまとのミーティングの頻度はどのくらいですか?その場合はオンラインでの実施でしょうか?
全体の定例は月に1回、または隔週で実施しています。開発の詳細については週次で、すべてオンライン上で実施しています。
オンラインミーティングで難しいと感じる点は、顔を知らない人が多数出席している会議だと、誰が話しているのか分からなくなる点でしょうか。例えば、お客さまを合わせると30人ぐらいの規模での会議の場合、お客さまが会議室で、自分は在宅であるようなときには、会議室のマイクで複数の方が発言されると分からなくなり、議事録の作成時や、ホワイトボードなどを使用してディスカッションをしたいようなときには難しいと感じています。
ただ、コロナ禍でリモートワークをするようになり、通勤時間の移動時間などがない分、その時間を業務に充てられるのはメリットだと感じています。
――開発環境を教えてください
自社の分析クラウドで、「Python」を使用して開発しています。データ分析をメインとするようになってから使い始めました。当初は本を読んだり、Webで調べたり、典型的なアルゴリズムを動かしてみたりしていました。最近はソリューション開発案件のなかで、これまでに検討されてきたコードを⾒ていく事が多いです。また、技術的な内容に関しては、上⻑や研究所の方がアルゴリズムの説明をしてくださる機会もあるので大変助かりますし、これまでに蓄えられた⽇⽴内での技術やナレッジを活用できるのが大きな利点だと思います。
昔はハードウェアの設定言語の「VHDL」や「Verilog」という言語で書いたり、テスト環境を作るのに「C言語」などを使ったりしていました。その経験が現在も役に立っていると思っています。
隠岐さんのとある一日
私の日々の仕事内容(ポイント)
-
データ分析の作業だけではなく、資料の作成やミーティングの時間も多い
提案・報告用の資料作成や、社内外のミーティングに充てる時間も多いです。
ミーティング後は議論内容をまとめ、今後の課題・アクションを具体化しています。
-
チーム内のコミュニケーションにはチャットを活用
20年4月以降は基本的に在宅勤務のため、チーム内の連絡は主にチャットを利用。
始業時は本日の予定を、終業時は成果や課題を報告して、チームメンバがお互いの進捗を把握し、困りごとは相談できるようにしています。
――1日の終わり(就寝前)に自己啓発の時間を確保されていますが、今行っていることは何でしょうか?
最近は、海外の方とのやり取りが増えてくるのではと考えて、TOEICの勉強をしています。
――スキルアップのためにやっていることを教えてください
実際に案件を進める上ではデータ分析作業を日立グループ内の他部署と分担することも多いですが、実際に⾃分でも生のデータを触る・分析することは⼼掛けています。
――今後の野望を教えてください
長期的な野望というと難しいですが、日立の事業、技術、社会環境などこれからもどんどん変化していく中で、自分ができることを考え、それにしっかりと取り組んでいくことを続けたいと思っています。
おわりに
どうでしたか︖データサイエンティストがどんなことをやっているのか、少しでも感じていただけたでしょうか︖
特に、椅子を例にお話しされた「ダメージ基準生存解析」の話は、非常に分かりやすく興味深かったですね。
設備や機械がいつ頃壊れるかを予測するのに、稼働データを活用した「ダメージ基準生存解析」が使われていること、そして、その具体的な解析手順や、進め方などについても、お分かりいただけたのではないでしょうか。
このシリーズでは様々な経歴のデータサイエンティストの方へのインタビューを通して、実際の業務内容や今後の展望、データサイエンティストあるあるなどを紹介していきます。
[シリーズ1:データサイエンティストの仕事~日立のデータサイエンティストに聞いてみた!~佐藤 達広~]
(https://qiita.com/KH_MOON/items/22e0913782e984f6fd26)
最後まで読んでくださり、ありがとうございました。