BIGLOG

BigQueryで始める、SQL入門

BigQueryの始め方

「BigQueryって何だか難しそう…」「環境構築って、プログラミングの知識がないとできないんじゃないの?」

もしあなたがそう思っているなら、ご安心ください!

BigQueryは、エンジニアでなくても驚くほど簡単に使い始められます。

この記事では、あなたがBigQueryを使うための「準備」を、ゼロから丁寧に、そして迷わないように解説していきますね。

必要なものはたったの2つだけ!

・インターネットに接続できるパソコン ・Googleアカウント(Gmailを使っていればOK!)

さあ、データを分析する世界への第一歩を踏み出しましょう!

はじめに

BigQueryは、一定の範囲内であれば無料で利用できます。

毎月以下の無料枠が提供されています。

・ストレージ: 10GBまで無料 ・クエリ処理: 1TBまで無料

この無料枠の範囲内であれば、料金を気にせずBigQueryを試すことができます。

まずはこの無料枠を活用して、BigQueryのパワーを体験してみましょう!

1. Googleアカウントの作成

BigQueryを利用するには、Googleアカウントが必要です。

すでにGmailなどをご利用でGoogleアカウントをお持ちの場合は、このステップはスキップできます。

1-1.Googleアカウント作成ページへアクセス

下記URLを押下し、作成ページへアクセス
https://www.google.com/intl/ja/account/about

1-2.アカウントの作成

『アカウントを作成する』を押下

1-3.アカウント名を入力

登録する名前を入力し、『次へ』を押下

1-4.基本情報の入力

生年月日と性別を入力し、『次へ』を押下

1-5.ユーザ名の入力

使用したいユーザ名(任意)を入力し、『次へ』を押下。
入力ユーザ名 + gmail.com が、そのままgmailアドレスになります。

※半角英字、数字、ピリオドのみ使用可能です。
※エラーの場合、上記以外の文字列が使用されているか、すでに使用されているユーザ名のため、再度確認してください。

1-6.パスワードの作成

設定したいパスワードを入力し、『次へ』を押下

※半角アルファベット、数字、記号を組み合わせたパスワードを入力してください。
※8文字以上で構成してください。

1-7.電話番号の入力

スマホの電話番号を入力し、『次へ』を押下

※SMSで認証等のメッセージを受け取るために要登録

1-8.電話番号認証

『1-7.』で登録した電話番号宛のSMSに6桁の認証コードが配信されていることを確認。

確認した認証コードを入力し、『次へ』を押下

1-9.予備メールアドレスの入力

予備に使用したいメールアドレスを入力し、『次へ』を押下

※任意のため、必要ない場合は『スキップ』を押下

1-10.登録内容の確認

登録内容を確認し、問題なければ『次へ』を押下

1-11.利用規約の確認

利用規約を確認し『同意する』を押下

1-12.登録確認

下記画像のメッセージが出力されたページへ遷移できていれば、登録完了です!

2.Google Cloudアカウントの作成

『1.』で作成したgoogleアカウントを使用し、Google Cloud アカウントの作成を行います。

2-1.Google Cloudアカウント作成ページへアクセス

下記URLを押下し、Google Cloudコンソールへアクセス
https://console.cloud.google.com

2-2.Google Cloudアカウントの作成

コンソールへアクセスすると添付画像のようなポップが表示されるため、『利用規約』にチェックを入れ、『同意して続行』を押下
※ポップが表示されない場合は、すでに登録が済んでいるため、そのまま次の工程へ進んでください。

これで、Google Cloud アカウントの作成は完了です!

3.プロジェクトの作成

Google Cloud アカウントの作成が完了したら、次にプロジェクトを作成します。

BigQueryにおける「プロジェクト」とは、簡単に言うと、BigQueryを含むすべてのGoogle Cloudサービスを使用する際の、作業の「入れ物」になります。

BigQueryにおける『入れる物』とは、データセット、テーブル、ビュー、保存されたクエリなどが該当します。

それでは、下記手順からプロジェクトを作成してみましょう!

3-1.プロジェクトの選択

Google Cloud コンソール(https://console.cloud.google.com)画面の左上から、プロジェクト選択枠を押下

3-2.プロジェクトの作成

表示されたプロジェクト選択画面右上から『新しいプロジェクト』を押下

3-3.プロジェクト情報の入力

プロジェクト作成にあたり、必要情報を入力

①:プロジェクト名(任意)を入力 ※ここでは『test-project』とします
②:『組織なし』で問題ありません
③:『作成』を押下

3-4.プロジェクトの作成確認

Google Cloud コンソール(https://console.cloud.google.com)画面右上の『通知』を確認し、『プロジェクト「test-project」を作成』と表示されていれば、問題なし

3-5.作成したプロジェクトの選択

『3-2.』と同様、再度プロジェクトを選択画面へアクセスし、『3-4.』で作成しプロジェクト名(test-project)を押下

3-6.プロジェクトの変更確認

Google Cloud コンソール(https://console.cloud.google.com)画面左上のプロジェクト選択枠が作成したプロジェクト名になっていれば、変更完了

4.データセットの作成

テーブルを作成する前に、テーブルを格納するためのデータセットを作成する必要があります。

データセットとは、作成した複数のテーブルをまとめておく、『大きな箱』と思ってください。

4-1.BigQueryワークスペースへアクセス

Google Cloud コンソール(https://console.cloud.google.com)画面の『BigQuery』を押下

4-2.データセットの作成

ワークスペース画面へ遷移したら、『エクスプローラー』の『プロジェクトID(添付画像マスク箇所)』の右横にある縦三点リーダーアイコンを押下し、続けて『データセットを作成』を押下

4-3.必要情報の入力

①:データセットID(任意)を入力 ※ここでは、『test』とします
②:『リージョン』を選択
③:『asia-northeast1(東京)』を選択
④:『データセットを作成』を押下

4-4.データセット作成確認

プロジェクト配下に、『4-3.』で指定したデータセット名『test』が表示されていれば、データセットの作成完了

5.テーブルの作成

テーブルとは、Excelのシートや方眼紙のような「情報を整理して保存しておく箱」だと思ってください。

例えば、家計簿をつけるとき、日付、項目、金額、お店、メモ…といった見出しを作って、そこに具体的な情報(行)を書き込んでいきますよね。

あの「日付」「項目」「金額」などの見出しと、それに沿って並んだ情報がまとまったものが「テーブル」です。

前述で作成したデータセットに、このテーブルが格納されることになります。

5-1.サンプルデータの用意

下記リンクから、サンプルデータをダウンロード

簡易的なユーザデータがcsv形式で格納されており、作成したテーブルに取り込むために必要となります。

5-2.テーブルの作成

『4-4.』で作成したデータセットの右横にある縦三点リーダーアイコンを押下し、続けて『テーブルを作成』を押下

5-3.必要情報を入力

テーブル作成にあたり、必要情報を入力する。

①:アップロードを選択
②:『5-1.』でダウンロードしたcsvファイルを取り込む
③:csvを選択
④:デフォルトのままでOK
⑤:デフォルトのままでOK
⑥:テーブル名(任意)を入力 ※ここでは『test_user_master』とします。
⑦:デフォルトのままでOK
⑧:自動検出にチェックを入れる
⑨:『1』を入力
⑩:『テーブルを作成』を押下

5-4.テーブルの作成確認

データセット配下に『5-3.』で設定したテーブル名が表示されていれば、作成完了

6.データ抽出

それでは、いよいよ作成したテーブルから、実際にデータを抽出してみましょう!

データ抽出は、SQLと呼ばれるプログラミング言語を使用します。

プログラミング言語といっても、PythonやJavaのように複雑なロジックを組むためのものではなく、主にデータベースに対して「問い合わせ(クエリ)」を行うことに特化しています。

まずは、SQLを使用し、クエリを作成していきます。

6-1.BigQueryワークスペースへアクセス

ワークスペースへアクセス(https://console.cloud.google.com/bigquery)し、クエリを作成していきます。

添付画像の赤枠にクエリを書きこんでいきます。

6-2.クエリの作成

最も基本的なクエリは下記の通りです。

SELECT
  *
FROM
  `【プロジェクトID】.【データセット名】.【テーブル名】`

このクエリを言語化すると、『指定されたテーブル内の全カラムデータを抽出しなさい』となります。

言語化されても良く分らないかもしれませんが、ここでは割愛し、別記事で詳しく説明いたします!

クエリ中の 【プロジェクトID】【データセット名】【テーブル名】 は、お使いのサイト内で例として記載されている具体的な名前に置き換えてください。

例えば、プロジェクトIDは【3-5.】で作成されたマスク箇所(仮にtest-projectとします。)、データセット名は【4-4.】で作成した『test』、テーブル名は【5-4.】で作成した『test_user_master』だった場合、それに合わせて記述します。

SELECT
  *
FROM
  `test-project.test.test_user_master`

また、対象テーブルの右横にある縦三点リーダーアイコンから、『IDをコピー』を押下することで、プロジェクトIDとデータセット名を含めたテーブル名を一括でコピーすることができます。

6-3.クエリの実行

クエリを作成したら、いよいよ実行です。

クエリをワークスペースへ書き込んだら、上部にある『実行』ボタン押下、またはショートカット(ctrl + Enter)の実行で、クエリが処理されます。

クエリの処理が完了すると、ワークスペース下部の『結果』タブを開き、クエリ結果を確認してください。

作成したクエリによって、抽出されたデータが表示されているはずです。

今回のクエリ例は、『指定されたテーブル内の全カラムデータを抽出しなさい』というクエリになりますので、『5-1.』で用意したサンプルデータがすべて、抽出結果として表示されているはずです。

これで、BigQueryの基本操作は完了です!お疲れさまでした!