曾无好事来相访,赖尔高文一起予。这篇文章主要讲述Spark-Local模式环境搭建相关的知识,希望能为你提供帮助。
一、前置准备CentOS7、jdk1.8、scala-2.11.12、spark-2.4.5
想要完成本期视频中所有操作,需要以下准备:
二、环境搭建 2.1 下载并解压
下载 ??Spark?
?? 安装包,这里我下载的是??spark-2.4.5-bin-hadoop2.7.tgz?
??。下载地址:????
# 解压
[xiaokang@hadoop ~]$ tar -zxvf spark-2.4.5-bin-hadoop2.7.tgz -C /opt/software/
# 重命名(可选)
[xiaokang@hadoop ~]$ mv /opt/software/spark-2.4.5-bin-hadoop2.7/ /opt/software/spark-2.4.5
2.2 配置环境变量
[xiaokang@hadoop ~]$ sudo vim /etc/profile.d/env.sh
在原来基础上更新配置环境变量:
export SPARK_HOME=/opt/software/spark-2.4.5
export PATH=${java_HOME}/bin:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:${ZOOKEEPER_HOME}/bin:${HIVE_HOME}/bin:${ZEPPELIN_HOME}/bin:${HBASE_HOME}/bin:${SQOOP_HOME}/bin:${FLUME_HOME}/bin:${python_HOME}/bin:${SCALA_HOME}/bin:${MAVEN_HOME}/bin:${GRADLE_HOME}/bin:${KAFKA_HOME}/bin:${SPARK_HOME}/bin:$PATH
执行 ?
?source?
? 命令,使得配置的环境变量立即生效:[xiaokang@hadoop ~]$ source /etc/profile.d/env.sh
2.3 修改配置
进入 ?
?${SPARK_HOME}/conf/?
?? 目录下,复制一份??spark-env.sh.template?
?文件进行更改[xiaokang@hadoop conf]$ cp spark-env.sh.template spark-env.sh
export JAVA_HOME=/opt/moudle/jdk1.8.0_191
export SCALA_HOME=/opt/moudle/scala-2.11.12
# Options read when launching programs locally with
# ./bin/run-example or ./bin/spark-submit
# - HADOOP_CONF_DIR, to point Spark towards Hadoop configuration files
SPARK_LOCAL_IP=hadoop
# - SPARK_PUBLIC_DNS, to set the public dns name of the driver program
2.4 启动测试
[xiaokang@hadoop ~]$ spark-shell
2.5 wordcount案例
准备一个需要统计词频的小文件,部分词频数据:
Spark之WordCount案例实操:
scala> val result=sc.textFile("file:///home/xiaokang/wordcount-xiaokang.txt").flatMap(_.split("\\t")).map((_,1)).reduceByKey(_ + _).collect
result: Array[(String, Int)] = Array((Flink,617), (Spark,614), (MapReduce,631), (Hive,636), (xiaokang,647), (HBase,642), (微信公众号:小康新鲜事儿,647), (Hadoop,644))
查看 Spark Web UI 界面,端口为?
?4040?
?:【Spark-Local模式环境搭建】
文章图片
推荐阅读
- HA-Spark集群环境搭建(Yarn模式)
- go中使用type关键字来定义类型别名
- 覆盖WordPress核心函数require_wp_db()
- 通过插件覆盖WordPress主题页面
- 覆盖子主题中的模块
- .onscroll函数在单个帖子页面上不起作用
- 一键更改WordPress主题定制器中的所有设置()
- 在不同的国家打开不同的页面()
- 导航以外没有其他可点击的内容(a hrefs或click函数)