算法|Python - 分治算法

MapReduce(分治算法的应用) 是 Google 大数据处理的三驾马车之一,另外两个是 GFS 和 Bigtable。它在倒排索引、PageRank 计算、网页分析等搜索引擎相关的技术中都有大量的应用。
主要思想
【算法|Python - 分治算法】分治算法的主要思想是将原问题递归地分成若干个子问题,直到子问题满足边界条件,停止递归。将子问题逐个击破(一般是同种方法),将已经解决的子问题合并,最后,算法会层层合并得到原问题的答案。
分治算法的步骤

  • 分:递归地将问题分解为各个的子问题(性质相同的、相互独立的子问题);
  • 治:将这些规模更小的子问题逐个击破;
  • 合:将已解决的子问题逐层合并,最终得出原问题的解;

分治法适用的情况
  • 原问题的计算复杂度随着问题的规模的增加而增加。
  • 原问题能够被分解成更小的子问题。
  • 子问题的结构和性质与原问题一样,并且相互独立,子问题之间不包含公共的子子问题。
  • 原问题分解出的子问题的解可以合并为该问题的解。
伪代码
def divide_conquer(problem, paraml, param2,...): # 不断切分的终止条件 if problem is None: print_result return # 准备数据 data=https://www.it610.com/article/prepare_data(problem) # 将大问题拆分为小问题 subproblems=split_problem(problem, data) # 处理小问题,得到子结果 subresult1=self.divide_conquer(subproblems[0],p1,..…) subresult2=self.divide_conquer(subproblems[1],p1,...) subresult3=self.divide_conquer(subproblems[2],p1,.…) # 对子结果进行合并 得到最终结果 result=process_result(subresult1, subresult2, subresult3,...)

    推荐阅读