Spark常见面试题
【Spark常见面试题】Spark常见面试题
Spark on Yarn 两种方式的区别以及工作流程
Spark 内存管理 官网优化这块查看
Spark作业资源的设置情况 excutor 个数 memory core driver
Shuffle 机制
DataFrame/DataSet 和 RDD的区别以及编程
数据倾斜
RDD的五大特性
Spark作业的执行流程:Count后续干了什么事情
Spark中的饮食转换的作用,结合Scala
Spark和MR的区别
Spark集群规模
Spark OOM如何解决
ThriftServer如何实现HA
Kafka整合Spark的时候OFFSET的管理
Spark Storm Flink 的区别
Spark使用中遇到过哪些问题,怎么解决,亮点在哪里
合理的算子选择
Catalyst的流程
推荐阅读
- 昨夜小楼听风
- 为什么你的路演总会超时()
- 深入理解Go之generate
- 遗憾是生活的常态,但孝顺这件事,我希望每一个人都不留遗憾
- 标签、语法规范、内联框架、超链接、CSS的编写位置、CSS语法、开发工具、块和内联、常用选择器、后代元素选择器、伪类、伪元素。
- 唱歌教学(导致嗓音损坏的几个常见的错误唱歌方法!)
- 迷茫是人生常态
- Hive常见问题汇总
- 数组常用方法一
- 【原创】君子之心,常怀敬畏