从停等协议到可靠传输：手把手图解RDT协议从1.0到3.0的演进之路-迪斯科星球

从停等协议到可靠传输：手把手图解RDT协议从1.0到3.0的演进之路

在计算机网络的世界里，数据传输的可靠性就像建筑的地基——虽然看不见，却决定了整个系统的稳定性。想象一下，当你发送一封重要邮件时，如何确保每个字节都准确无误地到达对方？这就是可靠数据传输协议（RDT）要解决的核心问题。本文将用工程师的视角，带你穿越RDT协议的进化史，从最基础的rdt1.0到成熟的rdt3.0，通过状态机图解和实战分析，揭示每个版本背后的设计哲学。

1. 可靠传输的基础概念

可靠数据传输不是魔法，而是一系列精心设计的机制组合。在开始探索具体协议前，我们需要明确几个关键概念：

信道特性：现实网络可能发生比特差错（bit error）、丢包（packet loss）、乱序（out-of-order）等问题
停等协议（Stop-and-Wait）：发送方每发送一个分组就等待确认，是最简单的流量控制方式
有限状态机（FSM）：用状态（state）、事件（event）、动作（action）来描述协议行为

提示：所有RDT版本都建立在"发送方-接收方"模型上，双方各自维护独立的状态机

让我们用一个简单类比理解RDT的作用——就像快递配送：

发送方=发货仓库
接收方=收货地址
ACK=签收回执
NAK=拒收通知
定时器=配送超时机制

2. rdt1.0：理想信道的乌托邦

2.1 基本假设与设计

rdt1.0建立在一个理想化的假设上：底层信道完全可靠。这意味着：

不会出现比特差错
不会发生数据丢失
保证按序交付

发送方状态机： [等待上层调用] -> 收到data -> [发送分组] -> 返回等待状态 接收方状态机： [等待下层调用] -> 收到分组 -> [交付数据] -> 返回等待状态

2.2 实现细节分析

虽然rdt1.0在实际中几乎不可用，但它确立了RDT协议的基本框架：

发送方操作序列：
- rdt_send(data)：应用层调用接口
- make_pkt(data)：构造分组
- udt_send(packet)：通过不可靠信道发送
接收方操作序列：
- rdt_rcv(packet)：从信道接收
- extract(data)：提取有效载荷
- deliver_data(data)：递交给应用层

注意：此时没有差错控制、没有流量控制，就像没有售后服务的网购

3. rdt2.0：对抗比特差错的第一次进化

3.1 ARQ机制的引入

rdt2.0开始面对现实——比特可能出错。其核心创新是ARQ（Automatic Repeat reQuest）机制：

ACK/NAK反馈：
- ACK：确认接收正确（相当于"收到完好"）
- NAK：报告检测到错误（相当于"请重发"）
校验和（Checksum）：采用类似UDP的校验方法检测比特差错：

# 简化的校验和计算示例 def compute_checksum(data): total = 0 for word in data: total += word total = (total & 0xFFFF) + (total >> 16) # 回卷处理 return ~total & 0xFFFF # 取反

3.2 状态机演变

发送方新增关键状态——等待ACK/NAK：

发送方FSM： [等待上层调用] -> 发送分组 -> [等待ACK/NAK] ^_________________________| 收到NAK或无效响应

接收方行为：

校验通过：发送ACK
校验失败：发送NAK

3.3 致命缺陷

rdt2.0存在一个关键漏洞——反馈信息本身可能出错！当ACK/NAK受损时：

发送方无法区分是ACK还是NAK受损
可能导致数据重复或丢失

4. rdt2.1：引入序列号的智慧

4.1 序列号解决方案

rdt2.1通过1比特序列号（sequence number）解决反馈歧义问题：

分组携带序号（0或1交替）
ACK也携带对应序号
接收方缓存最近正确分组

发送方处理逻辑：

if received_ACK.checksum_ok: if received_ACK.seq == current_seq: send_next_packet() else: retransmit() else: retransmit()

4.2 接收方去重机制

接收方需要处理冗余分组：

收到序列号	当前缓存序列号	动作
0	0	丢弃，重发ACK0
1	0	更新缓存，发ACK1
0	1	更新缓存，发ACK0

4.3 为什么不用NAK？

rdt2.1取消了NAK，完全通过带序号的ACK实现：

减少控制分组类型
避免ACK/NAK受损时的歧义
统一错误处理流程

5. rdt3.0：最终形态的诞生

5.1 定时器解决丢包问题

rdt3.0引入超时重传机制应对分组丢失：

每个分组发送时启动定时器
超时未收到ACK则重传
定时器时长 > RTT（往返时间）

发送方伪代码：

def send_packet(data): packet = make_pkt(data, seq) start_timer() udt_send(packet) state = WAIT_ACK def handle_timeout(): udt_send(last_packet) # 重传 start_timer()

5.2 完整状态转移图

发送方FSM现在包含定时器事件：

[等待上层调用] |___发送分组/启动定时器 | v [等待ACK] <---超时---+ | | |--收到ACK(seq匹配)--> [准备下一分组] |__收到ACK(seq不匹配)/ACK受损 | +---重传分组

5.3 性能优化思考

虽然rdt3.0实现了可靠性，但停等协议效率低下：

信道利用率 = (L/R) / (RTT + L/R)
- L=分组大小
- R=传输速率
例如：1Gbps链路，15ms RTT，1KB分组 → 利用率仅0.05%

这为后续滑动窗口协议的发展埋下伏笔。在实际项目中，我曾遇到一个案例：某物联网设备使用类rdt3.0协议传输传感器数据，在信号差的区域，频繁超时导致吞吐量骤降。后来通过动态调整超时阈值（基于历史RTT计算）改善了性能。

企业官网建设流程全解析