图解LCA：用‘跳台阶’和‘家族聚会’的故事，5分钟搞懂倍增与Tarjan算法-迪斯科星球

图解LCA：用‘跳台阶’和‘家族聚会’的故事，5分钟搞懂倍增与Tarjan算法

想象一下，你正在参加一场家族聚会。突然有人问你："你和表妹最近的共同祖先是谁？"你可能会从父母开始追溯，直到找到共同的爷爷奶奶。这个寻找"最近共同祖先"的过程，正是计算机科学中LCA（Lowest Common Ancestor）算法的现实映射。本文将用两个生活场景——"跳台阶"和"家族聚会"，带你直观理解LCA的两种高效算法：倍增法和Tarjan法。无需任何算法基础，跟着我们的图解故事，你会在不知不觉中掌握这些看似高深的概念。

1. 从家族树到算法：LCA基础课

任何一棵家族树都可以抽象为计算机中的"有根树"结构。在这种结构中：

每个节点代表一个家族成员
父子关系用连线表示
最顶端的祖先称为"根节点"

关键概念对照表：

现实概念	算法术语	示例
家族成员	树节点	你、父母、祖辈
父子关系	边	你→父亲，父亲→祖父
共同祖先	公共祖先	你和表妹的祖父
最近共同祖先	LCA	你和表妹的父母

当我们需要计算两个节点的LCA时，最直观的方法是"一步一步往上爬"——这就是朴素算法。例如要找到节点4和2的LCA：

比较深度：节点4（深度3）比节点2（深度2）更深
节点4先跳到父节点3（深度2）
现在两个节点深度相同，一起向上跳：
- 节点3→节点1
- 节点2→节点1
首次相遇在节点1，这就是它们的LCA

虽然简单，但这种方法的效率就像爬楼梯一步一个台阶——当树很高时（比如家族有20代），查询会变得非常慢。接下来我们要介绍的两种算法，就像给爬楼者装上了电梯和快捷通道。

2. 跳台阶法则：倍增算法详解

倍增算法的核心思想可以用"跳台阶"来比喻。想象你在一个可以跳1、2、4、8...级台阶的魔法楼梯上，如何用最少的跳跃到达目标楼层？

2.1 预处理：建造跳跃指南

在倍增算法中，我们预先计算每个节点的"跳跃能力表"——fa[i][j]数组，表示节点i向上跳2^j步会到达哪个祖先。这就像为每个家族成员准备一份"快速寻亲指南"：

# 预处理伪代码 def preprocess(): for j in 1..MAX_LOG: # 最大跳跃级别 for i in 1..n: # 所有节点 # 跳2^j步 = 先跳2^(j-1)步，再跳2^(j-1)步 fa[i][j] = fa[fa[i][j-1]][j-1]

跳跃能力表示例：

节点	跳1步	跳2步	跳4步
5	3	1	-
3	1	-	-
4	2	1	-

2.2 查询阶段：智能跳跃策略

实际查询时，我们遵循"能跳大不跳小"的原则：

对齐深度：让较深的节点跳到与另一个节点相同深度
- 比如节点5（深度3）要跳到节点2（深度2）的深度
- 可跳2步（但会超过），所以先跳1步到3（深度2）
同步上跳：两个节点一起尽可能大地跳，但不允许跳过LCA
- 节点3和节点2都尝试跳1步：
  - 3→1，2→1 → 相同，不跳
- 尝试跳更小步长...

最终实现代码虽然简洁，但蕴含精妙思想：

def lca(u, v): # 对齐深度 if depth[u] < depth[v]: u, v = v, u for i in range(MAX_LOG-1, -1, -1): if depth[u] - (1 << i) >= depth[v]: u = fa[u][i] if u == v: return u # 同步上跳 for i in range(MAX_LOG-1, -1, -1): if fa[u][i] != fa[v][i]: u, v = fa[u][i], fa[v][i] return fa[u][0]

提示：MAX_LOG通常设置为log2(树的最大可能深度)，确保能覆盖整棵树的高度。

3. 家族聚会法：Tarjan算法的离线智慧

如果说倍增法是"在线实时查询"，那么Tarjan算法就像在家族聚会上一次性解决所有亲戚关系问题。它的精妙之处在于：

一次性处理所有查询：聚会前收集所有"谁和谁是最近亲戚"的问题
深度优先遍历：像逐个问候亲戚一样访问每个节点
并查集记录：用"家庭关系网"动态维护祖先信息

3.1 算法流程分解

初始化阶段：
- 每个节点的祖先设为自己
- 标记所有节点为未访问
深度优先遍历：
- 访问节点u时，先处理其所有子节点v
- 处理完v后，将v的家族合并到u的家族（通过并查集）
查询处理：
- 当u的某个查询节点v已被访问过
- 通过并查集找到v所在家族的当前代表，即为LCA

家族聚会示例：

假设查询：(5,2), (4,6), (3,4)
访问顺序：1→2→5→3→4→6
处理节点5时，发现查询(5,2)中的2已访问，此时2的家族代表是1
处理节点4时，发现查询(4,6)中的6未访问，暂不处理
处理节点6时，发现查询(4,6)中的4已访问，此时4的家族代表是3

3.2 实现关键点

def tarjan(u): ancestor[u] = u # 初始化祖先 visited[u] = True # 标记已访问 for v in children[u]: # 处理所有子节点 if not visited[v]: tarjan(v) union(u, v) # 合并子节点家族到当前节点 ancestor[find(u)] = u # 处理所有相关查询 for v in queries[u]: if visited[v]: lca_result = ancestor[find(v)] # 记录u和v的LCA为lca_result

注意：Tarjan算法需要预先知道所有查询，适合"离线"场景。它的时间复杂度几乎是线性的，非常适合大规模查询。

4. 算法对比与实战选择

两种算法各有千秋，就像选择交通工具：

算法特性对比表：

特性	倍增算法	Tarjan算法
查询类型	在线实时	离线批量
预处理时间	O(n log n)	O(n α(n))
单次查询时间	O(log n)	O(α(n))
空间复杂度	O(n log n)	O(n)
实现难度	中等	较高
适用场景	动态树，实时查询	静态树，批量查询

实战选择建议：

选择倍增法当：
- 树结构可能动态变化
- 需要实时响应查询
- 实现相对简单，适合竞赛快速编码
选择Tarjan法当：
- 树结构固定不变
- 需要处理大量查询（如数万次）
- 对时间效率要求极高

在最近的项目中，我需要处理一棵百万节点的家族树和十万级查询。使用Tarjan算法后，查询时间从原来的秒级降到了毫秒级——就像在家族聚会上一次性理清了所有亲戚关系，而不是每次有人问都要重新追溯。

企业官网建设流程全解析