PySpark SQLの簡単な紹介と、実際PySpark SQLを使ってみます。
PySparkスクリプトを書くときに、知っておいたらいい概念とポイントをまとめました。
PySparkで使用されるDataFrameというオブジェクトがどのようなものなのかを見てみます。
RDDのAPIを使って簡単なプログラムを作ってみます。
RDDとは何かおよびRDDオブジェクトに対して使用できるAPIを紹介して、実際データを操作してみましょう。
Sparkの特徴、PySparkの概要およびユースケースをご紹介します。
Dockerを使ったPySparkを動かす環境を構築する方法をご紹介します。
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。