Apache Spark

【PySpark入門】第6弾 Spark SQLを使ってみよう

PySpark SQLの簡単な紹介と、実際PySpark SQLを使ってみます。

【PySpark入門】第7弾 PySpark運用Tips!

PySparkスクリプトを書くときに、知っておいたらいい概念とポイントをまとめました。

【PySpark入門】第5弾 DataFrameとは?

PySparkで使用されるDataFrameというオブジェクトがどのようなものなのかを見てみます。

【PySpark入門】第4弾 実戦!RDDを操作してプログラムを作ってみる

RDDのAPIを使って簡単なプログラムを作ってみます。

【PySpark入門】第3弾 RDDの理解

RDDとは何かおよびRDDオブジェクトに対して使用できるAPIを紹介して、実際データを操作してみましょう。

【PySpark入門】第1弾 PySparkとは?

Sparkの特徴、PySparkの概要およびユースケースをご紹介します。

【PySpark入門】第2弾 PySparkの環境構築

Dockerを使ったPySparkを動かす環境を構築する方法をご紹介します。

AWS Summit 2015 参加レポート(2)

'15年入社の橋本です。 先日AWS Summit Tokyo 2015に展示員をしつつ参加してきましたので、その時のレポートをお送りします。