AWSのBIツール Amazon QuickSight がついにリリースされました!

AWS運用自動化サービス「Cloud Automator」
この記事は1年以上前に書かれたものです。
内容が古い可能性がありますのでご注意ください。

皆さんこんにちは!サーバーワークス IoT担当の中村です。
昨日(2016年11月16日)についにAmazon QuickSight(以下QuickSight)と呼ばれるAWSの新サービスがGA(General Available)になりました。
QuickSightとは、AWSによって提供されているBIのサービスで、AWSのストレージ、データベース等をデータソースに、データの分析や、可視化を行うことができます。

QuickSightは実は去年のre:Inventで発表されたもので、これまではLimitedPreviewという形で限られたユーザのみが利用できる状態でした。そして、今回のGAにより全てのAWSユーザーが利用できるようになりました!(なお、現在はNorthern Virginia, Oregon, Irelandの3つのリージョンで利用可能です)

QuickSightの特徴

新サービスということで、この記事ではQuickSightの特徴をスクリーンショットを添えてご紹介します。

用語説明

まずはじめにQuickSightの用語説明です。

データソース

データソースとは、分析の元となるデータが置いてある場所です。AWSでいえば、例えばRedshiftのクラスターや、RDSのインスタンスがそれにあたります。

データセット

データセットとは、データソースから分析に必要なデータを抽出したものです。抽出だけではなく、他のデータと関連付けたりデータの加工も行うこともあります。

アナライズ

アナライズとは、分析できる状態になっているものです。QuickSightでは、データソースを指定して、データソースからデータセットを作成し、データセットから分析(アナライズ)を開始します。QuickSightでは、分析するためにデータを様々なグラフで表すことができます。

操作はブラウザで完結

QuickSightの機能は全てブラウザから利用することができます。ブラウザだけでデータの閲覧や分析が可能です。専用クライアント等は必要ありません。

なお、対応ブラウザについては、2016年11月現在で以下のブラウザがサポートされています。
Safari(7~9), Chrome(直近の3バージョン), Edge(最新版), Internet Explorer(11), Firehox(直近の3バージョン)
http://docs.aws.amazon.com/ja_jp/quicksight/latest/user/sign-up-existing.html

以下は、ブラウザでQuickSightを利用している様子です。
quicksight

※ブラウザでQuickSightを利用している図

様々なデータソースに対応

分析の元のなるデータ(データソース)は、様々なものがサポートされています。もちろんQuickSightはAWSのサービスなので、AWSのデータベース・ストレージ系のサービスは多く対応しており、現在ではS3, Redshift, RDS, Auroraが対応しています。さらに、今後KinesisやEMR、DynamoDBもサポートが予定されています。

datasources※選択可能なデータソースの図

他にも、データソースとして静的ファイルをアップロードできたり、MySQL等のRDBがAWS以外のところにある場合でも、データソースとして指定できます。

また、Salesforceのデータ(オブジェクト、レポート)もデータソースとして取得できるようになっています。弊社ではSalesforceを積極的に使っているため、非常にありがたい機能です。

データの結合や加工ができる!

QuickSightでは、データソースからデータセットを作成する際に、データの結合や加工を行うことができます。例えば、分析に使用しない列は取り込まないように設定したり、元データの値を計算した結果を新しい列として足したりすることができます。計算において利用できる関数もかなりの数が用意されています。

試しにdateDiff関数とnow関数を使って各レコードのデータが何日前なのかを表す新しい列を足してみます。
このように、dateDiff({timestamp}, now()) と書くだけで、この日付が今日から何日前なのかを簡単に計算することができます。

date-difference※新しい列を足している図

テーブルを結合する場合は、テーブルを複数選んで結合することができます。結合タイプについては、内部結合や外部結合がわかりやすく絵で説明されています。

join

※テーブルの結合を行っている図

データセットはインメモリ計算エンジン(SPICE)に保持できる!

データソースから取ってきたデータはSPICEと呼ばれる超高速なパラレル・インメモリ計算エンジンに保持することができます。SPICEはSuper-fast Parallel In-memory Calculation Engineの略だそうです。厨二心がくすぐられる格好いいネーミングですね。

名前は兎も角、SPICEにデータセットを一度保持してしまえば、それ以降にデータの分析を行う場合はデータは超高速なインメモリ計算エンジンであるSPICEから取得されます。そのため、一度SPICEにデータが入ってしまえば、その後の解析などで描画がもたつくことはありません。

ただし、SPICEにデータを保持するデータ量により課金額もあがるため、SPICEに保持するデータ量は気にしておく必要があります。SPICEに保持しているデータ量はマネジメントコンソールからいつでも確認することができます。また、データセットを作成する際に、SPICEに保持するかどうかを選択することが可能です。

以下がデータセットを作成する際にSPICEに取り込むかどうかの選択と、SPICEの容量を表示している様子です。

spice1spice2

※データセットをSPICEに取り込むかどうかの選択と、SPICEの容量を表示している図

SPICEに保持したデータは他のBIツールから参照できる!

QuickSightの特徴としてあるのが、SPICEに保持したデータを別のBIツール等から参照できる機能があります。これにより、既にBIツールを使っているユーザーであっても、使い慣れたBIツールを使いつつ、QuickSightの超高速なインメモリ計算エンジン(SPICE)の恩恵に預かることができます。フロントエンドとバックエンドでいいとこ取りを出来るようになるわけですね。

…この機能は是非試してみたかったのですが、残念ながら2016年11月現在ではまだ提供されていないようです。今後に期待ですね!

まとめ

というわけで、今回は先日GAになった新サービスAmazon QuickSightの特徴を紹介いたしました。待ちに待ったAWSによるBIのサービスです。今後の機能拡張などを楽しみにしつつ、検証を続けていきたいと思います!

また、お手持ちのAWS環境に既にデータが溜まっている方は、これを機に手元のデータを分析してみてはいかがでしょうか!

AWS運用自動化サービス「Cloud Automator」