最近データ分析、機械学習の書籍がだんだん増えて、書籍を買う時どれを買えばいいのかわからない方がいるでしょう。ここで、データ分析、機械学習に関する良書10冊を紹介していきます。前回のデータ分析に必要なデータソース20選(無料で使える)と一緒、みなさんに少し役に立てば幸いです。
1、Head Firstシリーズ
Head Firstデータ解析 ―頭とからだで覚えるデータ解析の基本
Michael Milton (著), 大橋 真也 (監訳), 木下 哲也 (翻訳)
データ分析に関する入門レベルの本なので、内容が比較的にやさしいです。とはいえ、基本的な知識を網羅しており、説明もわかりやすいです。最後にR言語を言及しています。以下の二冊は同じシリーズの本です。
Head First Statistics ―頭とからだで覚える統計の基本
Dawn Griffiths (著), 黒川 利明 (翻訳), 木下 哲也 (翻訳), 黒川 洋 (翻訳), 黒川 めぐみ (翻訳)
Head First SQL ―頭とからだで覚えるSQLの基本
Lynn Beighley (著), 佐藤 直生 (監訳), 松永 多苗子 (翻訳)
2、ビューティフルデータ (THEORY/IN/PRACTICE)
Toby Segaran (編集), Jeff Hammerbacher (編集), 堀内 孝彦 (翻訳), 真鍋 加奈子 (翻訳), 苅谷 潤 (翻訳), 小俣 仁美 (翻訳), 篠崎 誠 (翻訳) データ分析業界の39人の著名人の経験を集まる本です。各章は一つの問題に集中し、彼らがどうのように開発上の困難を克服したのかを紹介しており、データ分析の応用と解決策の理解にとても役立ちます。
3、R in Action: Data Analysis and Graphics with R
Robert Kabacoff (著)全面的で詳細なRのガイドとして、Rとその強大な機能をまとめて、使用された統計の実例を挙げます。それに、従来のやり方では扱いにくい、複雑で不完全なデータと非正規則分布データをうまく処理する方法を説明します。
4、Data Analysis with Open Source Tools: A Hands-On Guide for Programmers and Data Scientists
Philipp K. Janert (著) 多くのシミュレーションプロセスと結果を表示するほか、データ解析のためにオープンソースツールを利用する実例を含めています。この本を読めば、オープンスースツールの使い方と用途がわかります。 ![2018112805.jpg](https://qiita-image-store.s3.amazonaws.com/0/266670/800ca1c1-1ec6-66df-7d9f-cb0b3b87abce.jpeg)5、Data Mining Techniques: For Marketing, Sales, and Customer Relationship Management
Gordon S. Linoff (著), Michael J. A. Berry (著)最新のデータマイニング手法を利用して、直接販売の応答率を高める、顧客基盤を特定し、信用リスクを推定するなどの業務上の問題を解決する方法を紹介します。 さらに、分析するデータの準備や企業のデータマイニングに必要なインフラストラクチャの作成など、より高度な内容もカバーしています。
6、Python Data Science Handbook: Essential Tools for Working with Data
Jake VanderPlas (著)
各章はPythonのデータサイエンスにおける1つまたは2つの重要なツールキットを紹介します。プログラミングの経験が持って、 データの解析、操作および可視化を目的にPythonを利用するデータサイエンティストに適します。大量の情報の処理が必要となる人にとって、これは、データの操作、変換、クリーンアップ、可視化そして統計モデルと機械学習モデルの構築などの日常問題に効率的に対処できるようにする価値が高いマニュアルです。
7、Storytelling with Data: A Data Visualization Guide for Business Professionals
Cole Nussbaumer Knaflic (著)
大量のケーススタディを通じて、データ可視化の基本知識だけではなく、どのようにデータの活用によって引きつけて説得力のあるストーリーを作成し、効果的なコミュニケーションを実現するのかも紹介します。 コンテキストの理解、チャートの選択、視聴者の視線の集中、デザイナーのような考えやデータでストーリーの作成などの内容が含まれています。
8、Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理
Wes McKinney (著), 小林 儀匡 (翻訳), 鈴木 宏尚 (翻訳), 瀬戸山 雅人 (翻訳), 滝口 開資 (翻訳), 野上 大介 (翻訳)
多くのケーススタディによって、Pythonライブラリ(NumPy、pandas、matplotlib、IPythonなど)を使用して一連のデータ解析上の問題を効果的に解く方法を示します。
9、Machine Learning in Action
Peter Harrington (著)
機械学習の基本理論と日常のデータ分析のツールを組み合わせて、複雑で理解しにくい機械学習アルゴリズムをやさしく説明します。 柔軟性の高いPythonプログラミング言語でデータの分類、集計、予測およびアドバイスなどの高度な機能を実装するプログラムを構築します。
10、実践 機械学習システム
Willi Richert (著), Luis Pedro Coelho (著), 斎藤 康毅 (翻訳)
この本に従えば、Pythonによって機械学習を勉強し、プロジェクトを立てることができます。機械学習を勉強しようとするPythonプログラマーに向いています。
以上の本を読み通す限り、データ分析の理論がだいたいわかるようになります。実際の応用では企業と業務のニーズに応じて練習と勉強をする必要があります。
ツイッターでデータ分析・可視化、仕事のスキルについての面白い情報をシェアしています。よかたっら覗いてください!
前はデータ分析職につきたい方のために、十週間の学習計画を紹介しました。ここはインフォグラフィックにまとめてみます!記事と合わせてお読みください!
— HaileeKana (@HaileeKana) July 12, 2020
記事のURL:https://t.co/1wBiLQiRzi @HaileeKana #note https://t.co/wWH0jMBwHb