【DISTINCT】重複除外でユニークデータを操作しよう

抽出したデータを見て、「同じ名前や項目が何度も出てきて邪魔だな」と感じたことはありませんか？

Excelなら「重複の削除」ボタンを押す作業ですが、SQLではDISTINCT（ディスティンクト）という命令1つで、重複のない「ユニークな（唯一の）データ」を作成できます。

1．DISTINCTの基本

DISTINCTは、表示したいカラムの直前に記述します。

SELECT 
  DISTINCT カラム名
FROM 
  テーブル名;

例えば、顧客が住んでいる「地域の種類」を一覧にしたいとします。

まずは、customers テーブルから prefecture（顧客の居住地域）をそのまま出力してみましょう。

SELECT 
  prefecture
FROM 
  `test.customers`;

実行すると、グリーン枠のように『東京都』が重複して表示されます。

これでは、結局「何種類の地域があるのか」を把握するには不便ですよね。

ここで、重複を解消するために DISTINCTを使用します。

SELECT 
  DISTINCT prefecture
FROM 
  `test.customers`;

先ほどまで3つ存在していた『東京都』が、1つに集約されました。

これは、DISTINCTが指定したカラムをスキャンし、同一データを除外して「ユニークな（重複のない）値」だけを抽出したからです。

お疲れさまでした！

DISTINCTをマスターすれば、膨大な生データから「結局、何種類あるのか？」を瞬時に把握できるようになります。

データがスッキリ整理されると、その後の抽出・集計がずっと楽になります。