Apache Spark 入门

2017-3-23 Frank 服务器

[TOC]

环境

MacOs

下载

下载之后解压即可。

python example

交互式shell基础

./bin/pyspark

spark显著的贡献是其弹性分布式数据集(RDD),下面用spark源码目录中的README 文件来创建一个RDD。

>>> textFile = sc.textFile("README.md")

让我们来看几个动作

>>> textFile.count()  # Number of items in this RDD
126

>>> textFile.first()  # First item in this RDD
u'# Apache Spark'

官方文档

标签: spark

发表评论 登录

Top