LoginSignup
0
0

データ基盤学習必見 クラウドデータレイク(OREILLY出版)早速読んでみた 2024/5/17

Posted at

1.前置き

みなさんこんにちは、私は日頃データ基盤の構築を行なっております。

近年、オライリー者からデータ基盤の本が多数出てきていること、本当に嬉しく思います。

さて、2024年5月17日にそのオライリー社から新たに
クラウドデータレイクという本が出版されました

今回はその本の感想をしていきたいと思います。

解説は思ったのですが、内容がかなり網羅的に記載されている分、記事にすると余計抽象的になってしまい記事の内容を考え中です。

2.まずはこの本の感想

現場のエンジニアにとってはちょっと浅いと感じるかもしれない。

これが一番の感想でした。
この本の本当のターゲットは恐らく、
『これからデータ基盤を構築したいけど、概略もよくわからない』
『データレイクってなに?』
『なんでデータレイクにデータを入れる必要があるの?』
これがあまり理解できていない方に対しての本なのかなと思います。

また、最近機械学習などの流行から
『データレイクハウス』
という言葉が出てきていると思います。

それらの説明をわかりやすくしています。

経営者に読んでほしい理由

なぜか
・コスト面もかなり多く記載されている(第2章・第3章)
・PaaS製品の各々の強みや特徴が凝縮されている(第2章・第4章)
・このような質問に対して、どの解答であればデータレイクが重要となるか(第7章)

いざデータ基盤を構築しようとなると、
ユーザーのニーズを除いて、やはりサービスの選定が大事になってくるかと思います。

それらの手助けとなるものが簡潔に記載されています。
また、それぞれのアーキテクチャのコスト面の比較などもしています。

データ基盤の初学車にも読んでほしい

なぜか
・HadoopやSparkなどのコンポーネント等の簡易説明(第4章)
・データの圧縮に関係するparquetフォーマットの説明(第5章)

エンジニアが読むべき章は恐らく第4章と第5章と第6章かなと思います。

章ごとに対象者を選定してみた

この本自体は、第1章から第8章で構成されています。
ざっと章ごとに対象者に丸をつけました。

image.png

まるはつけましたが、
現場のエンジニアが経営者側の視点を持つことも非常に大事だと思います。

将来 PMとしてキャリアチェンジしたい方は是非全部読んでください

3.まとめ データ基盤の概要を掴むにはこれ一本でいいかも

それくらいかなり網羅的に記載されています。
デメリットとしては、網羅的すぎてあまり深いところまでは記載されていないことです。

なので、これからデータ基盤を勉強したい!って方には読んでいただきたいと思います。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0