Amazon RedshiftにSQL Workbenchから接続してみた

記事タイトルとURLをコピーする
こんにちは。



寒い夜には芋焼酎のお湯割りもいいけど、芋焼酎の燗もいいよね、と思うセールスチーム 永淵(<a href="http://twitter.com/nagafuchik" target="_blank">@Nagafuchik</a>)です。


さて、前回のエントリーに続きAmazon Redshiftをテーマに投稿します。



<!--more-->



今回は自身のPCにある<a href="http://www.sql-workbench.net/" target="_blank">SQL Workbench</a>からAmazon Redshiftに接続してサンプルデータを取り込んでみます。



SQL Workbenchのセットアップ方法は<a href="http://docs.aws.amazon.com/ja_jp/redshift/latest/mgmt/connecting-using-workbench.html" target="_blank">こちらのリンク</a>に詳しく記載されています。



&nbsp;

1. SQL Workbenchのインストール

こちらのページ:<a href="http://www.sql-workbench.net/">http://www.sql-workbench.net/</a>&nbsp;からパッケージをダウンロードし、ローカルにインストールします。



インストールしたSQL Workbenchを起動すると、こんな画面が表示されます。



<img alt="" src="http://corporate-tech-blog-wp.s3.amazonaws.com/tech/wp-content/uploads/2014/02/redshift_sqlworkbench01.png" style="width: 500px; height: 399px;" />

2. SQL Workbenchの起動

「Manage Drivers」から「PostgreSQL」のドライバーを選択します。



<img alt="" src="http://corporate-tech-blog-wp.s3.amazonaws.com/tech/wp-content/uploads/2014/02/redshift_sqlworkbench02.png" style="width: 500px; height: 372px;" />



※PostgreSQLのJDBC&nbsp;ドライバーが無い場合は別途セットアップしてください。<span style="line-height: 1.6em;">(参考:</span><a href="http://www.postgresql.jp/document/7.4/html/jdbc.html" style="line-height: 1.6em;">http://www.postgresql.jp/document/7.4/html/jdbc.html</a><span style="line-height: 1.6em;">)</span>



&nbsp;



ドライバーを選択したら、次はRedshiftの接続情報を入力します。



AWS Management ConsoleのClusterをクリックすると、詳細情報が表示されます。



JDBSのURLをクリックするとコピーできますのでコピーしましょう。



<img alt="" src="http://corporate-tech-blog-wp.s3.amazonaws.com/tech/wp-content/uploads/2014/02/redshift_manage08.png" style="width: 700px;" />



コピーしたURLをSQL Workbenchの「URL」にペースト。RedshiftのClusterを作成したときに設定した、DBのユーザー名とパスワードを入力します。



<img alt="" src="http://corporate-tech-blog-wp.s3.amazonaws.com/tech/wp-content/uploads/2014/02/redshift_sqlworkbench03.png" style="width: 500px; height: 405px;" />



これで完了。



少しドキドキしながら「OK」をクリック



「connecting...」と表示され・・接続できました。



&nbsp;

3. サンプルデータを投入する

無事、Redshiftに接続できましたので、次はサンプルデータを投入してみます。



どんなデータでもかまいませんが、AWSが<a href="http://docs.aws.amazon.com/redshift/latest/gsg/getting-started-create-sample-db.html">こちら</a>のページでサンプルを提供しているので今回はこれを利用してみたいと思います。



まずはテーブルを作成します。



<img alt="" src="http://corporate-tech-blog-wp.s3.amazonaws.com/tech/wp-content/uploads/2014/02/redshift_sqlworkbench04.png" style="width: 500px; height: 396px;" />



次にS3上に置かれているサンプルデータを投入します。



サンプルデータのフォーマットは下記を参考に編集してください。
copy users from 's3://<東京リージョンのサンプルデータをひっぱっt"awssampledbapnortheast1"を入力>/tickit/allusers_pipe.txt' CREDENTIALS 'aws_access_key_id=<アクセスキーIDを入力>;aws_secret_access_key=<シークレットアクセスキーを入力>' delimiter '|';
&nbsp;



<img alt="" src="http://corporate-tech-blog-wp.s3.amazonaws.com/tech/wp-content/uploads/2014/02/redshift_sqlworkbench05.png" style="width: 500px; height: 397px;" />



だん。



&nbsp;

4. SELECT文をたたいてみる

データが投入できましたので、どんなデータが入っているのかのぞいてみましょう。
  • table名に「sales」が含まれるデータをセレクト(およそ1秒)
<img alt="" src="http://corporate-tech-blog-wp.s3.amazonaws.com/tech/wp-content/uploads/2014/02/redshift_sqlworkbench06.png" style="width: 500px; height: 396px;" />
  • 上客(違ww)を抽出(およそ8秒)
<img alt="" src="http://corporate-tech-blog-wp.s3.amazonaws.com/tech/wp-content/uploads/2014/02/redshift_sqlworkbench07.png" style="width: 500px; height: 396px;" />



速い、速いぞRedshift!!!



&nbsp;



こんな感じで、RedshiftにSQL Workbenchから接続することができました。



データはS3やDynamoDBからも引っ張ってくることができます。DynamoDBを活用していらっしゃるような方にはぜひ、Redshiftと組み合わせて使っていただきたいですね。

まとめ

今回紹介したSQL Workbench以外にもRedshiftに接続するためのクライアントツールは用意されています。今までも使ってきたような慣れた方法でRedshiftを活用することができそうですね。



でもでも、データを投入するで終わってはせっかくのビッグデータも台無しです。ということで次はいろいろなBIツールと接続することで、データの可視化の方法を探ってみたいと思います。



次はJaspersoftとTableauとの連携について書きます(予定で未定)



&nbsp;