3.8 深度学习方法与经典方法的对比与选型

走到这里，同学们已经同时掌握了两套工具：第二章的经典方法（MUSIC、ESPRIT、Capon），和第三章的深度学习方法（CM-CNN 分类、IQ-LSTM 回归）。手里有两把刀，就必然面临一个工程问题：这道题该用哪把？

这个问题没有一劳永逸的答案，但有判断的逻辑。本节的目标就是把这套逻辑说清楚——不是给出一张"深度学习必胜"或"经典方法必胜"的结论表，而是帮助读者建立一个基于具体条件做出合理选择的思维框架。

3.8.1 从根本差异说起

在讨论"谁更好"之前，必须先说清楚两类方法为什么会有不同的表现——它们的底层逻辑是不同的。

经典方法是模型驱动的：MUSIC 和 ESPRIT 利用阵列数据满足特定矩阵结构这一物理先验，推导出精确的子空间分解算法。只要阵列模型准确、信噪比足够，这个推导保证了算法在统计意义上的最优性——两者在高 SNR 下都能逼近克拉美-罗下界（CRB）。模型越准，表现越好；模型一旦偏离（阵元误差、互耦、相干信号），性能就会下滑。

深度学习方法是数据驱动的：网络从训练数据中学习"输入特征到角度"的映射，不需要手工推导公式。它的鲁棒性来自训练集的覆盖范围，而不来自物理先验的精确性。这意味着：只要训练时见过的条件，网络就有能力应对；没见过的条件，则可能失效。

这个根本差异，决定了两类方法在几乎所有性能维度上的互补格局，而不是简单的替代关系。

3.8.2 多维度对比：哪里领先，哪里落后

下面从六个工程实践最关心的维度，逐一做出有针对性的分析。

维度一：精度（理想条件）

所谓"理想条件"，是指阵列模型准确、信噪比中等偏高（ $\gtrsim 5$ dB）、快拍数充足（ $N \geq 10M$ ）的标准仿真场景。

在这种条件下，MUSIC 和 ESPRIT 是当之无愧的胜者。它们能够达到甚至接近 CRB，这是统计意义上的最优。深度学习方法在高 SNR 区间的 RMSE 曲线通常会出现"平台效应"——精度提升到某个水平后不再随 SNR 增大而继续下降，与 CRB 之间存在固定的差距。原因在于网络的泛化误差（由训练数据量和网络容量决定）构成了一个精度下限，CRB 描述的统计最优性在理论上不保证被神经网络实现。

结论：高 SNR、理想阵列、不差计算资源的场景，经典子空间方法是精度上的首选。

维度二：低 SNR 与少快拍的鲁棒性

经典子空间方法有明确的 SNR 工作下限。在 2.7 节的仿真实验中，我们看到 MUSIC 的 RMSE 曲线在某个 SNR 阈值以下会突然跳升，进入"阈值效应"区域——从接近 CRB 骤降为估计几乎无效。快拍数不足时情况类似， $N < M$ 时样本协方差矩阵秩亏，子空间划分完全失效。

深度学习方法在这两个方向上表现出更好的连续性。只要训练集包含了低 SNR 和少快拍的样本，网络就会在这些困难条件下形成一定的应对能力——尽管精度仍然不高，但至少不会像经典方法那样出现"断崖式失效"。从 3.7.5 节的按 SNR 分段评估图中可以直观地看到这一点：在 $[-10, -5)$ dB 区间，深度学习方法的 RMSE 往往比 MUSIC 低，即便在训练集也覆盖了这段 SNR 范围的条件下。

结论：低 SNR（阈值以下）或极少快拍（ $N \ll M$ ）场景，深度学习方法的鲁棒性更好。

维度三：阵列误差下的鲁棒性

真实硬件中的阵列误差（天线位置偏差、幅相不一致、互耦效应）会破坏经典方法依赖的理想导向矢量模型。子空间分解因为信号子空间的计算依赖精确的相位关系，对误差尤为敏感，即使很小的阵列误差也可能带来显著的 DOA 偏移甚至失效。

深度学习方法应对阵列误差的方式则完全不同：在训练时把随机生成的阵列误差加入仿真数据，网络就会在数据增广的过程中被动学到对这类误差的抵抗能力。它不需要知道误差的确切数学形式，只要训练集里见过足够多的"有误差的输入-正确角度"配对，网络就能从中提炼出鲁棒的映射关系。研究表明，针对不完美阵列专门设计和训练的深度学习模型（如 SDOA-Net），在幅相误差、位置扰动、互耦效应同时存在的复杂场景下，精度可以比 MUSIC 高出 $30\%$ — $40\%$ 。

结论：存在显著阵列误差、无法精确校准的低成本硬件场景，深度学习方法有明显优势。

维度四：推理速度与实时性

经典方法的主要计算瓶颈是两个：特征值分解（ $\mathcal{O}(M^3)$ ）和谱搜索（ $\mathcal{O}(M \cdot I)$ ， $I$ 为搜索网格点数）。对于 $M=8$ 阵元、 $I=1801$ 格点的标准配置，MUSIC 在 CPU 上每次估计需要约 $1 \sim 5$ ms。ESPRIT 无需谱搜索，速度更快，但仍有特征值分解的开销。

深度学习方法训练阶段耗时较长（可能需要数分钟到数小时），但推理阶段只是一次前向传播：一系列矩阵乘法和激活函数。对于中等规模的 CNN 或 LSTM，在 CPU 上的推理时间通常在 $0.1 \sim 1$ ms，在 GPU 上还能进一步大幅压缩，且具有天然的批处理并行性。

结论：对推理延迟敏感的嵌入式或实时系统，深度学习方法（特别是 GPU 部署时）有速度优势。对于单次估计、无 GPU 的轻量场景，两者相差不大。

维度五：可解释性与可诊断性

经典方法的每一步都有清晰的数学意义，出错时有迹可循：特征值曲线平坦可能意味着低 SNR 或相干信号，伪谱峰值位置异常可能意味着阵列误差，信源数估计偏大会导致虚假峰值……工程师可以通过检查中间结果诊断问题所在。

深度学习方法是黑盒。网络给出一个角度，很难说"为什么是这个值"。出错时调试难度大，往往只能通过消融实验（逐步去掉某个模块、更换某类训练数据）来缩小问题范围。这在工程维护和安全关键应用中是一个不可忽视的代价。

结论：对可解释性、可审查性要求高的场合（如航空、军事、医疗），经典方法更容易满足验证要求；原型快速验证或性能导向的研究场景，深度学习方法的黑盒特性通常可以接受。

维度六：泛化到新场景的能力

经典方法只要信号模型大致成立，就能"开箱即用"——换一套阵列、换一个频段、换一种信号，只要 ULA 的相位关系成立，MUSIC 和 ESPRIT 无需任何调整。

深度学习方法的泛化边界由训练集决定。训练数据覆盖的阵元数、快拍数、角度范围、SNR 区间、阵列误差类型，都构成了网络"舒适区"的边界。一旦测试场景超出这个边界（例如训练时 $M=8$ ，测试时 $M=16$ ；或训练时无阵列误差，测试时有强互耦），性能可能大幅下降，有时甚至不如经典方法。这也是为什么 3.7.6 节的调参建议里，特别强调要用比训练范围更宽的 SNR 区间来测试泛化。

结论：跨场景迁移（换阵列、换频段、换应用）能力方面，经典方法更稳健；深度学习方法的泛化范围需要通过精心设计训练集来主动扩展。

3.8.3 一张选型参考表

把以上六个维度的分析汇总成一张对照表，方便在工程决策时快速参考：

场景条件	推荐方法	理由
理想阵列，中高 SNR（ $\gtrsim 5$ dB），快拍充足	经典子空间方法	可逼近 CRB，精度最优
低 SNR（阈值以下），精度要求适度放宽	深度学习方法	避免阈值效应，有更平稳的退化曲线
快拍数极少（ $N < M$ ）	深度学习方法	子空间方法秩亏失效，DL 可通过训练适应
阵列存在显著误差，难以精确校准	深度学习方法	数据增广使网络被动习得鲁棒性
需要实时低延迟推理（GPU 部署）	深度学习方法	前向传播速度快，支持批处理并行
要求强可解释性、可审查（安全关键）	经典方法	每步有数学依据，易于诊断和验证
场景多变，需要无标注、开箱即用	经典方法	不依赖训练数据，只要模型大致成立
信源数未知且动态变化	经典方法（MDL/AIC） + 伪谱回归	经典法估计信源数，DL 法处理鲁棒性
计算资源极其受限（无 GPU，低功耗）	视具体规模而定	ESPRIT 无谱搜索，轻量 CNN 也可考虑

3.8.4 两条不应走的弯路

在实际工程中，初学者最容易走两条弯路，值得专门提出来讨论。

弯路一：把深度学习当万能药。 看到"深度学习方法在某篇论文里超越了 MUSIC"，就认为所有场景都应该用深度学习。这忽略了一个关键问题：论文里的实验条件是什么？大多数声称超越经典方法的深度学习论文，其实验场景通常是低 SNR、不完美阵列、快拍数受限这几类经典方法固有弱点的情形。在理想条件下、把 CRB 作为参照的严格对比中，经典方法并不逊色。盲目地在所有场景都换成深度学习，结果可能是花了大量标注和训练成本，在许多场景下性能反而更差。

弯路二：用仿真结论代替实测验证。 深度学习方法在精心设计的仿真环境中表现往往非常漂亮，RMSE 可以做到很低。但仿真数据和真实采集数据之间存在"仿真到真实"（Sim-to-Real）的分布偏移——真实场景中的噪声分布、阵列非理想性、信号调制方式，都不一定和仿真完全吻合。经典方法因为依赖物理先验而不是数据统计规律，这种偏移对它的影响相对可控；深度学习方法在真实数据上的表现往往比仿真里差一截。第四章将专门讨论这个问题在毫米波雷达实测场景中的具体表现。

3.8.5 融合思路：不必二选一

读到这里，读者朋友们应该已经意识到：两类方法并不是非此即彼的竞争关系，而是可以协同工作的互补工具。实践中已经发展出几种成熟的融合思路：

用经典方法做粗估，用深度学习做精化。 先用 MUSIC 或 ESPRIT 得到一个粗略的 DOA 候选区间，再用网络在这个小范围内做高精度的精化估计。经典方法负责快速定位方向、确定信源数，深度学习方法负责在极低 SNR 或阵列误差下提升最终精度。

用经典方法生成标签，训练深度学习模型。 用高质量真实采集数据，借助 MUSIC 自动标注 DOA 标签，训练针对具体硬件的深度学习模型。这绕开了"真实数据无标注"的难题，同时让网络学到目标硬件的具体误差特性。

深度展开（Deep Unfolding）：把算法迭代结构嵌入网络。 这是目前研究最活跃的一个方向——把 MUSIC、ESPRIT 等经典算法的迭代结构拆开，变成可学习的网络层，让网络同时具备物理先验的指导和数据驱动的适应能力。这个思路在 3.9 节的拓展内容中会做进一步介绍。

3.8.6 小结

本节从精度、鲁棒性、速度、可解释性和泛化能力五个维度，系统比较了深度学习方法与经典方法在 DOA 估计任务中的表现差异，并给出了一张场景导向的选型参考表。

核心结论可以用一句话概括：经典方法在理想条件下接近理论最优，深度学习方法在困难条件（低 SNR、阵列误差、少快拍）下具有更好的鲁棒性，两者是互补而非替代的关系。

真正的工程选型不是选"哪类方法更好"，而是选"在当前场景的约束条件下，哪类方法的优势能被充分发挥、弱点能被有效规避"。带着这个判断框架，无论面对什么新场景，读者朋友们都有了一套可以落地的决策逻辑。

接下来的 3.9 节是本章的拓展内容，将介绍一种把经典算法迭代结构和深度学习融合起来的新范式——深度展开网络。阅读前建议对经典算法的迭代流程（特别是 MUSIC 的谱搜索和协方差矩阵的迭代精化）有一定熟悉程度。

3.8.1 从根本差异说起​

3.8.2 多维度对比：哪里领先，哪里落后​

维度一：精度（理想条件）​

维度二：低 SNR 与少快拍的鲁棒性​

维度三：阵列误差下的鲁棒性​

维度四：推理速度与实时性​

维度五：可解释性与可诊断性​

维度六：泛化到新场景的能力​

3.8.3 一张选型参考表​

3.8.4 两条不应走的弯路​

3.8.5 融合思路：不必二选一​

3.8.6 小结​