集合演算とは?
テーブル同士の内容を、足したり引いたりする共通部分を抽出したりすることです。
UNION(重複行を削除する和)
結合結果で重複があった場合は、重複を排除する。テーブルの内容を足し算することです。重複行は自動で削除されます。
UNION ALL(重複行を残す和)
結合結果で重複があった場合は、重複を排除せず全て表示する。テーブルの内容を足し算することです。重複行を残します。
UNIONに比べると無駄なソートが発生しないので、完全に排他になっているもの同士をくっつけたい場合はできるだけUNIONよりもUNION ALLを使った方が良い。
INTERSECT(テーブルの共通部分を選択する。)
必ず2つのテーブルを使用してレコードの共通部分を抽出します。重複行は自動で削除されます。(残す場合はUNIONと同じように「ALL」をつけます。)
なお、MySQLでは使用することはできません。
EXCEPT(差を求める。)
レコードの引き算を求めます。
なお、Oracleでは、「EXCEPT」ではなく、「MINUS」という演算子を使います。
ユースケース
マージされるSELECT文同士で使用するテーブルが異なるケースです。
もちろん、FROM句でテーブルを結合すればCASE式でも対応できるかもしれませんが、それはUNIONを使えば必要のない結合になるので微妙なところでしょう。
判断基準としては、インデックスがちゃんと効いているかになります。UINONを使った場合にインデックスがちゃんと効くのであれば選択肢として良い形となるでしょう。(具体的に言えば、UNIONを使った場合にうまく絞り込みの利くインデックスが利用できて、かつ非UNIONの場合はインデックスが利用できない場合でフルテーブルスキャンが発生する場合はUNIONを使った方がパフォーマンスが良くなります。ポイントとしては、UNIONのWHERE句の選択性がどれくらい高いかが大事でしょう。)
UNIONの問題点
ただ、基本的にUNIONはSELECT文を2回発行することになります。なので、パフォーマンスはあまりよろしくないケースも多いです。CASE式に置き換えられないかどうか検討するのが良いでしょう。
UNIONは文による分岐、CASE式は式による分岐でどうしても手続型言語などの通常のプログラミング言語の経験が長い方はUNIONを好んで使いがちになってしまいますが、CASE式という宣言型言語を習得すればSQL中級者を目指せます。
この記事へのコメントはありません。