#はじめに
「AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出]」を読み終えた。
#書籍情報
タイトル:AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出]
出版社:株式会社技術評論社
著者:大城 信晃、マスクド・アナライズ、伊藤 徹郎、小西 哲平、西原 成輝、油井 志郎
媒体:Kindle
#目次
目次は以下のとおりで、各章の下に最大9のコンテンツがある。
第 1 部 プロジェクトの準備
第 1 章 AI・データ分析業界の概要
第 2 章 データサイエンティストのキャリアと雇用
第 3 章 データサイエンティストの実務と情報収集
第 2 部 プロジェクトの入口
第 4 章 社内案件の獲得と外部リソースの検討
第 5 章 データのリスクマネジメントと契約
第 3 部 プロジェクトの実行
第 6 章 AI・データ分析プロジェクトの起ち上げと管理
第 7 章 データの種類と分析手法の検討
第 8 章 分析結果の評価と改善
第 9 章 レポーティングとBI
第 10 章 データ分析基盤の構築と運用
第 4 部 プロジェクトの出口
第 11 章 プロジェクトのバリューと継続性
第 12 章 業界事例
#特徴
①読者の立場ごとに読み進めることが可能
読者を以下の4つの区分に分け、各コンテンツの先頭に対象読者が定義されている。
以下が対象読者の定義。
- 学生・データ分析プロジェクト未経験者
- 学生やすでに社会人として働かれている方の中で、AI・データ分析に興味はあるものの実務経験がない
- ジュニアデータサイエンティスト
- データ分析組織を持っている企業の中で、先輩のデータサイエンティストの指示を仰ぎながら日々業務に取り組んでいる
- ミドルデータサイエンティスト
- ジュニアデータサイエンティストを数年経験し、一通りのデータ分析業務を自身の判断で進めることができる
- シニアデータサイエンティスト
- ミドルデータサイエンティストからさらに実務経験を重ねることで、プレーヤーとしてだけではなく、プロジェクトや組織全体のマネジメント経験も豊富なゼネラリストとして活躍されている
###対象読者の整理
####第 1 部 プロジェクトの準備
章 | タイトル | 学 生 | ジュニア | ミドル |
---|---|---|---|---|
1 | AI・データ分析業界の概要 | ◎ | ○ | |
2 | データサイエンティストのキャリアと雇用 | ◎ | ○ | ○ |
3 | データサイエンティストの実務と情報収集 | ◎ | ◎ | ○ |
####第 2 部 プロジェクトの入口
章 | タイトル | 学 生 | ジュニア | ミドル |
---|---|---|---|---|
4 | 社内案件の獲得と外部リソースの検討 | ○ | ◎ | |
5 | データのリスクマネジメントと契約 | ○ | ◎ |
####第 3 部 プロジェクトの実行
章 | タイトル | 学 生 | ジュニア | ミドル |
---|---|---|---|---|
6 | AI・データ分析プロジェクトの起ち上げと管理 | ○ | ◎ | |
7 | データの種類と分析手法の検討 | ○ | ◎ | ○ |
8 | 分析結果の評価と改善 | ○ | ◎ | ◎ |
9 | レポーティングとBI | ○ | ◎ | ○ |
10 | データ分析基盤の構築と運用 | ○ | ◎ |
####第 4 部 プロジェクトの出口
章 | タイトル | 学 生 | ジュニア | ミドル |
---|---|---|---|---|
11 | プロジェクトのバリューと継続性 | ○ | ◎ | |
12 | 業界事例 | ◎ | ◎ | ◎ |
私は・・・。考えることなく学生・データ分析プロジェクト未経験者ですね。
②各コンテンツごとにキーワードが設定されている
各コンテンツの先頭にキーワードが列挙されている。
キーワードは最後に索引として列挙されている。
③参考書籍の紹介
各コンテンツの最後にそのコンテンツを更に深堀りするために有益な書籍が紹介されている。
私のように独学するエンジニアにとっては有益な情報。
①②はこんな感じ
コンテンツ「1-1 AI・データ分析業界の歩み」の対象読者とキーワード
#読了1回目
###読み終えて
2021/04/25(日)全てのコンテンツを読みきった。
なるほど、データサイエンス・AIの領域については、学生であっても一般的なシステム構築のエンジニアとしてはミドルである(であってほしい)ため、全体的に内容を飲み込むことができた。
これまで闇雲にPython・スクレイピング・AIなどキーワードだけ拾ってきては独学を開始してみては途中で失敗していたが、この書籍と出会ったことで、データサイエンスの全体像を俯瞰することででき、独学の方向性が明確になった。
これまでの私の独学のスタイルは「スキルを身につけること。」が目的だったが、それでは不完全で、「○○を実現させたいからスキルを身につける。」が大事だった。
それに気づかせてくれた一冊だった。
注意が必要なポイントは、環境構築方法、ロジック、数式などの実務的な情報はこの書籍には記載されていない。
あくまでも全体を俯瞰することを目的に本書を読むことをおすすめする。
###刺さったコンテンツ
- 1-3 従来のシステム開発とAIプロジェクトは何が違うのか 従来型システム開発との違い データの重要性 契約と責任
- 2-3 データサイエンティストの生存戦略 データ分析スキルだけでは勝てない時代へ 働く現場
- 3-4 情報収集の方法 Webサイトをチェックする 勉強会に参加する 書籍を調べる 情報が集まってくる環境を作る もっと深い情報を得るために
- 3-5 情報発信の方法 ブログで技術情報を発信する 自ら勉強会やイベントを開催する 継続的に発信する
- 5-2 データに関わる法律 個人情報を扱う必要があるか 個人情報保護法 匿名加工情報 自身のケースに当てはめる
- 7-2 データの実情と前処理の大切さ データの不備 代表的なデータの前処理 業界ごとのデータの不備
- 7-3 ツール・プログラミング言語の選択 運用をふまえた選定ポイント 分析ツールの種類・特徴 各プログラミング言語の特徴
- 7-4 目的によるデータ分析手法の違い データ分析手法の選択 探索的データ解析手法 仮説検証的データ分析手法(予測) 「教師あり」か「教師なし」か
- 10-4 クラウドの選定 どのクラウドサービスを使えばいいのか? 大規模データ分析・機械学習を行うならGCPを選択
- 10-5 業務用データベースと分析用データベース なぜDWHで分析基盤を作るのか? RDBとNoSQLの違い NoSQLとRDBの連携
- 10-6 データの種類とデータ基盤設計 データの種類 役割で見るデータベース
- 10-7 AI実運用のためのスキルセット MLOpsという考え方 すべてのスキルセットを持ち合わせた人材はいない
- 12-1 金融業界における事例と動向 クレジットスコアリング 会計の自動仕訳 データ活用の鍵はオープンバンクAPIの動向
- 12-4 教育業界の事例と動向 アダプティブラーニング データサイエンス教育 データサイエンスはこれから
- 12-6 EC業界における活用事例 レコメンドエンジン ダイナミックプライシング ビジュアル検索
業界全体を俯瞰するための書籍とはいえ、やはり技術的な記載があるコンテンツが刺さり、12章の業界事例では自身が開発プロジェクトに携わっている(いた)業界の事例が刺さりました。
###書籍紹介
本書で紹介された約30冊の参考書籍のうち、特に気になった書籍3冊。
Pythonによるデータ分析入門 第2版 ─NumPy、pandasを使ったデータ処理
前処理大全[データ分析のためのSQL/R/Python実践テクニック] Kindle版
見て試してわかる機械学習アルゴリズムの仕組み 機械学習図鑑 Kindle版
・・・やはり技術的な書籍が気になるようで。同じ轍を踏むことにならなければよいのだが。