MacOs
下载之后解压即可。
交互式shell基础
./bin/pyspark
spark显著的贡献是其弹性分布式数据集(RDD),下面用spark源码目录中的README 文件来创建一个RDD。
>>> textFile = sc.textFile("README.md")
让我们来看几个动作
>>> textFile.count() # Number of items in this RDD
126
>>> textFile.first() # First item in this RDD
u'# Apache Spark'
标签: spark
发表评论 登录: