MapReduce核心原理(下)

MapReduce 中的排序 MapTask 和 ReduceTask 都会对数据按key进行排序。该操作是 Hadoop 的默认行为,任何应用程序不管需不需要都会被排序。默认排序是字典顺序排序,排序方法是快速排序 下面介绍排序过程: MapTask 它会将处理的结果暂时放到环形缓冲区中,当环形缓冲

    推荐阅读