2024/4/12に翔泳社よりApache Spark徹底入門を出版しました!いやー、長生きはするものです。出版社から本を出せる日が来るとは。発起人の方に感謝です。
こちらのイベントで紹介させていただきました!
つきましては、書籍のサンプルノートブックの翻訳版(全てではありませんが)のリポジトリを作成しました。
また、上記ノートブックをウォークスルーする記事を以下にまとめました。
第2章
第3章
第4章
第5章
第7章
第10章
- SparkによるAirbnbデータセットのクレンジング
- Sparkによる線形回帰モデルのトレーニング
- Sparkによるワンホットエンコーディング、ログスケールによる予測性能の改善
- Sparkによる決定木モデルのトレーニング
- Sparkによるハイパーパラメータチューニング
- SparkによるK-Meansクラスタリング
第11章
第12章
相当夜鍋して翻訳しました!ご興味がある方は是非!