Spark安装|Spark安装,伪分布式环境的搭建与样例程序的测试
【Spark安装|Spark安装,伪分布式环境的搭建与样例程序的测试】1.将Spark的安装包上传到服务器,解压,配置环境
安装包地址:链接:https://pan.baidu.com/s/1IyGq3uYU2Yyp5KEfhaHKbw
提取码:6zt9
解压:
tar -zxcfspark-2.1.0-bin-hadoop2.7.tgz -C /opt/module/spark-2.1.0-bin-hadoop2.7
配置环境:
[root@bigdata111 conf]# cp spark-env.sh.template spark-env.sh
[root@bigdata111 conf]# vi spark-env.sh
将环境变量,主机地址,端口等信息添加到spark-env.sh中
export JAVA_HOME=/opt/module/jdk1.8.0_181
export SPARK_MASTER_HOST=bigdata111
export SPART_MASTER_PORT=7077
2.配置主从节点:
[root@bigdata111 conf]# vi slaves
伪分布式,就是将master和worker放在同一台服务器上:在slaves中添加:
bigdata111
3.测试
开启Spark:
[root@bigdata111 spark-2.1.0-bin-hadoop2.7]# sh ./sbin/start-all.sh
jps查看进程
[root@bigdata111 spark-2.1.0-bin-hadoop2.7]# jps
67219 Master
67410 Worker
70665 Jps
[root@bigdata111 spark-2.1.0-bin-hadoop2.7]#
然后在浏览器中输入 bigdata111:8080:
文章图片
image.png 用spark-submit测试spark 自带的实例程序:
/opt/module/spark-2.1.0-bin-hadoop2.7/examples/jars中有Spark自带的实例程序
蒙特卡洛求PI(圆周率)
./spark-submit --master spark://bigdata111:7077 --class org.apache.spark.examples.SparkPi/opt/module/spark-2.1.0-bin-hadoop2.7/examples/jars/spark-examples_2.11-2.1.0.jar 500
解释:
spark-submit:执行spark任务的工具之一
--master:连接到主节点
spark://bigdata111:7077: 主节点的地址
--class org.apache.spark.examples.SparkPi:spark任务的全类名
/opt/module/spark-2.1.0-bin-hadoop2.7/examples/jars/spark-examples_2.11-2.1.0.jar:jar包的位置
500:参数
运行的结果:
Pi is roughly 3.1414508628290174
推荐阅读
- Mac安装Chromedriver
- MongoDB,Wondows下免安装版|MongoDB,Wondows下免安装版 (简化版操作)
- 标签、语法规范、内联框架、超链接、CSS的编写位置、CSS语法、开发工具、块和内联、常用选择器、后代元素选择器、伪类、伪元素。
- MAC安装Mongo
- 【Hadoop踩雷】Mac下安装Hadoop3以及Java版本问题
- Spark|Spark 数据倾斜及其解决方案
- react|react 安装
- VueX--VUE核心插件
- python-安装sublime遇到异常
- typeScript入门基础介绍