この記事では、私が読んできたRDB、SQL、データモデリング関連の技術書の中でよかったものをあげようとおもいます。
1. 失敗から学ぶRDBの正しい歩き方
おすすめ度 ★★★★★
こちらは、DBの設計や運用に有用な知識を、アンチパターンの解説とともに紹介するという構成になっています。
第1正規形になっていなかったり、idに一意に識別する以外の意味が存在していたり、nullばかりのカラムがあったり...といろいろな都合でわれわれが陥りがちなアンチパターンが紹介され、それらアンチパターンに陥らない方法が完結に解説されています。
DBの設計・運用ノウハウとしてきれいにまとまっていて読みやすくいい本です。
2. SQLアンチパターン
おすすめ度 ★★★★★
こちらは、DB設計やSQLについて犯しがちなアンチパターンを紹介し、それらの解決策を提示するというテイストで書かれている本です。
「1.」であげた本とスタイルは似ていますが中身がよりディープなので、「1.」の次に読むとおもしろいかもしれません。
タイトルに「SQL」とはいっているとおり、以下のようなSQLに焦点をあてたアンチパターンも紹介されています。
- LIKEや正規表現による部分文字列検索がもたらす検索の遅さ
- SQLインジェクション
- 修正が難しい複雑で長いSQL文
個人的には、13章で null の扱い方を解説している章がおもしろかったです。
3. 理論から学ぶデータベース実践入門
おすすめ度 ★★★★★
こちらは、RDBの教科書的な本でもあり、後半ではDBの設計についても解説している本です。
どれか一冊読むならこれが良いとおもえるくらい、RDBの基本が詰まった良書です。
個人的には、「第9章 履歴データとうまく付き合う」 がよかったです。
リレーションでデータを表現するRDBにとって、順序性が存在する履歴データの扱いは本質的に難しさをはらんでいると解説されています。
そのため、直観的に履歴データを設計すると、アプリケーション側が複雑になってしまいがちです。
そこで本章では、完璧ではないかもしれないけれど、より良い履歴データを扱う設計方法が紹介されます。
こういう知識は明日から使えていいですね。
また、「第13章 リファクタリング」 もいい内容です。
データベースをリファクタリングする際の具体的な手順と、ベストプラクティスについて説明されています。
具体的には、リファクタリングによってアプリ側に意図しない悪影響を及ぼさない方法について解説されており、いいノウハウだとおもいました。
個人的な経験ですと、プログラムをよりよくリファクタリングしようとして、本質的な問題がどこにあるか考えていくと、最終的にはテーブル設計を見直さないといけない、という結論にたどり着いたことがあります。
スパゲッティコードとなってしまったフロントのリファクタリングを検討したことがあるのですが、以下のような理由で、テーブル設計がある程度の水準に保てないと、アプリケーション側が非常に複雑になるんだなぁ...と痛感したことがあります。
かつてDBリファクタリングを検討した経緯
- フロントにドメイン知識が流出しており、フロント側でたくさんデータの操作や判断をしてしまっていた。
- この原因は、APIが返す情報が不足していたり、そもそも必要なAPIが存在しなかったりといったところにあったため、これを修正するには、フロント側で判断しなくてすむようにAPIが適切な情報を返すようにする必要があった。
- しかし、APIもスパゲッティコードと化しており、この原因は正規化されていないテーブルにあった。
またテーブルリファクタリングを検討する際は本章を再読しようとおもいます。
話題は逸れますが、個人的には上記の経験を通して、APIというものは情報を受け渡すことが大事なのではないと感じました。
APIにおいて重要なのは仕様を公開するということ、つまり、エンジニアがそのAPIのドキュメントを見たときに、「ああ、だいたいこんなかんじで使えばいいんだろうなあ」 とイメージできることがとても大切であり、そういう状態を目指したいと感じました。
4. 楽々ERDレッスン
おすすめ度 ★★★★☆
こちらは、テーブル設計に主眼をおいた解説本です。
特に後半では、実際の帳票から具体的なステップをふんでデータモデリングを解説しており、内容もわかりやすいものとなっています。
この本では、以下のような手順でモデリングしています。
- コアとなるイベントを見つける。
- そのイベントに関連するリソースを列挙する。
- 項目をうめる。
- リレーションをつける。
個人的には、まずイベントを抽出したあとで、関連するリソースを書き出していくというやり方が参考になりました。
イベントに注目しながらER図を作ると、データだけでなく業務フローを意識しながらモデリングしていくことになるので、作りやすいのかもしれません。
5. 事業分析・データ設計のためのモデル作成技術入門
おすすめ度 ★★★★☆
こちらは、DB設計というより事業を分析するというところに力点がおかれていますが、モデリングに関する書籍です。
事業で扱うモノをイベントとリソースにわけ、それらがどういう関係にあるのかを分析する手法について書かれています。
記法や用語に慣れない部分が個人的にありましたが、各章の練習問題では、具体的な業務システムの画面を事例に、そのシステムをモデリングしていく流れが解説されています。
基本的には、事業に登場するイベント or リソースを抽出し、それらが「イベント - リソース」関係、「リソース - リソース」関係、「イベント - イベント」関係のいずれにあたるのかに注目し、透徹したルールにしたがって機械的にモデリングしていきます。
これらが最終的にどういうクラスやDBになるのかイメージしにくいところが個人的にありましたが、考え方はとても参考になりました。あと、ちゃんと正規化するのってだいじだな、と改めておもいました。
6. リレーショナルデータベース入門
おすすめ度 ★★★☆☆
こちらは、入門とありますが非常に硬派なRDBの教科書です。
リレーショナルデータベースというもの自体を学びたいひとに向いています。
個人的には難しくて全部読むのは厳しかったので、自分がある程度理解できていると思える部分にしぼって、RDBを理論的に説明するとこうなるんだなぁ...と思いながらよみました。
正規形について記述される部分など、厳密な定義を理解しながら読めるので、頭の中で整理して理解することができたとおもいます。