はじめに
こんにちは。リンクアンドモチベーションの柳です。
本記事はリンクアンドモチベーション Advent Calendar 2023の10日目の記事です。
先日、先輩にJOIN句を使用する際に、「JOINするテーブル間の多重度を意識している」という話を聞きました。
そのため、本記事では、DBのテーブルの多重度とJOIN句の関係性について学んだことを共有します。
SQLについて学びたてのみなさん、是非読んでいってください!
多重度とは何か?
これから多重度について説明するにあたり、以下の定義を使用します。
UMLでは、それらのインスタンスにおける多重度をクラス間の両端に記述することができる。多重度とは、その関連に参加するオブジェクトの数を示すものである。
難しいですね。
では、以下のような具体例について考えてみましょう!
左のテーブルは、企業に関する情報を格納するテーブルです。
右のテーブルは、従業員に関する情報を格納するテーブルです。このテーブルはカラム(項目)として、その従業員がどの企業に所属しているのかを示すcompany_idを所有しています。
例えば、A株式会社という企業に、従業員として山田一郎さん、山田二郎さん、山田三郎さんが所属しているとします。
companiesテーブルに「A株式会社」(1レコード)が、employeesテーブルに「山田一郎」「山田二郎」「山田三郎」(3レコード分)が格納されています。
この時、employeesテーブルの「山田一郎」「山田二郎」「山田三郎」の3レコードは、カラムcompany_idとして「A株式会社」を示すcompany_id(=1)を所有します。
companiesテーブルの1レコード「A株式会社」に関連するレコードが、employeesテーブルには3レコード(「山田一郎」「山田二郎」「山田三郎」)存在するということです。
つまり、companiesテーブルとemployeesテーブルは、companiesテーブルの1レコードとemployeesテーブルの複数(1つ以上)のレコードが関連するということです。これを1対nの関係と呼びます。
このような、テーブル同士の関連の構造(1対n、1対1等)を示すものを多重度です!
1対nの関係とJOIN句の関係性
では、なぜJOIN句を使用する際に多重度を意識すると良いのでしょうか?
ここからは、多重度の一つである1対nの関係とJOIN句の関係性についてまとめていきます。
これ以降、1対nの関係において1レコードを所有する方のテーブルを「1のテーブル」、複数のレコードを所有するテーブルを「nのテーブル」とします。
1のテーブルにnのテーブルをJOINする
1のテーブル(companyテーブル)にnのテーブル(employeeテーブル)をJOINしてみましょう!
結合前のcompanyテーブルは以下のようになっています。
companyテーブルにemployeeテーブルをJOINすると以下のような実行結果になります。
レコード数が3行から10行に増えていることがわかりますね。
nのテーブルに1のテーブルをJOINする
nのテーブル(employeeテーブル)に1のテーブル(companyテーブル)をJOINしてみましょう!
結合前のemployeeテーブルは以下のようになっています。
employeeテーブルにcompanyテーブルをJOINすると以下のような実行結果になります。
レコード数が変わらず10行のままであることがわかりますね
つまり、1のテーブルにnのテーブルをJOINすると、レコード数が増える(nのテーブルに1レコードしか存在しない場合は変わらない)が、nのテーブルに1のテーブルをJOINすると、レコード数は変わらないことがわかりましたね。
まとめ
以上より、1のテーブルにnのテーブルをJOINすると、レコード数が増える(nのテーブルに1レコードしか存在しない場合は変わらない)が、nのテーブルに1のテーブルをJOINすると、レコード数は変わらないことがわかりました。
確かに、1のテーブルにnのテーブルをJOINする際には注意が必要ですね。
実行結果のレコード数を絞るためにテーブルをJOINしたつもりが、逆に増やしてしまっていたなんてことが起きるかもしれません。
そういった際は、必要なレコードだけになるよう、WHERE句を適切に活用していきましょう!
今回は簡単な例であるためわかりやすいですが、テーブル数が多くなり、実行結果としてレコード数が数えいれないほど表示されている時には見逃してしまう観点でした。
是非、皆さんもJOINをする際は、JOINする2つのテーブルの多重度を意識していきましょう!