Spark - Master和Worker spark

之前在分布式高可用集群安装中，可以看到这个集群是主从架构，在Spark集群方式中，叫做Standalone集群。
主节点叫做Master，Master除了对Worker、Application、Driver等管理外，还要负责对整个集群中所有资源的统一管理和分配。这篇主要还是讲对Worker的管理。
Worker是工作节点，他会把自身的资源信息，比如CPU、内存大小等提供给Master，由Master对Worker的资源进行调度。
流程集群启动的时候，只有Master节点，为了能够对各个Worker进行管理，Worker启动的时候需要向Master进行注册，把自己的信息，包括Ip信息、端口、CPU、内存大小等，注册到Master，这样Master就可以知道这个Worker的具体情况。

文章图片

Master接收到Worker的注册请求后，就会把Worker的信息放入内存中，便于资源的分配以及调度，并且为了容灾考虑，把Worker的信息进行了持久化，这样新选举出来的Master能够从持久化中读取Worker的数据，而不用担心上一个Master节点中的内存数据丢失。

文章图片

Master处理完Worker请求后，就会发信息告知Worker已经注册，Worker就会把Master的信息保存在内存中。

文章图片

为了保证Master知道自己是存活的，于是worker每隔15秒开始发送心跳给Master。这个Master的信息就是上面一步保存在内存的信息。Master收到心跳信息后，就会更新Worker的最后心跳时间。

文章图片

除了Worker主动发送心跳告知Master自己的状态是存活的，Master也会每隔60秒去检查内存中Worker的集合，把最后心跳时间超过60秒的筛选出来，把这些Worker从内存以及持久化中移除。

文章图片

源码思维导图 【Spark - Master和Worker】master启动
worker启动并注册到master
master-处理消息
Worker-处理信息

Spark - Master和Worker

推荐阅读

威能代码f20 威能代码f4

苹果开发软件app，如何开发苹果应用程序

关于祖国母亲的优美句子

为何现在和平精英的外挂如此猖狂？

1岁宝宝婴儿坠床两天后命丧黄泉，家长们一定要了解这些医学常识

欧楷创始人欧阳询皇甫诞碑

三文鱼寄生虫发病前兆

凤眼果相克食物

李女士|手机死机拿去修，手机突然多出陌生照片？结果华为送了一部新手机

电脑怎么更换office2013的安装密钥

吃了不熟的糯米粉怎么办

虞子期真的是虞姬哥哥吗?虞子期是一个什么样的人？

如：LV等,价格在10000元以上我爱人要我每年给她买一个奢侈品包,她的要求真的合理吗？

手上有油漆怎么洗

如何用玫瑰花做香水只用花和水如何用玫瑰花做香水，如何用玫瑰花做香水?

三星洗衣机代码er是什么原因导致的？怎么解决

发膜的正确使用方法

营业性演出许可证怎么办演出经营许可证怎么办理

班花系列|我用Python爬取1000封情书助力室友表白班花，却反转再反转...原来这就是班花的终极秘密！

三菱空调不制冷是什么原因三菱空调不制冷的原因及解决办法