导读

尝一脔肉，知一镬之味；悬羽与炭，而知燥湿之气；以小明大。见一叶落，而知岁之将暮；睹瓶中之冰，而知天下之寒；以近论远。

---《淮南子·说山训》

古人通过"尝一脔肉"便知整锅汤的味道，通过"见一叶落"便知秋意将至。这种"以小明大、以近论远"的观察与推断方式，其实恰恰概括了波达方向（Direction of Arrival，DOA）估计的核心思想：从有限的局部观测出发，反推出空间中的未知信息。

在现代工程中，我们无法用肉眼直接"看到"电磁波或声波的来源，但可以借助空间中排列成阵列的多个传感器——例如天线或麦克风——捕捉信号到达各个传感器时的细微差异，包括时间差、相位差与幅度差。正是这些差异，构成了后续方向估计的物理依据，也是本教程将带领大家逐步理解并动手实现的核心问题。

0.1 DOA估计的应用背景与核心问题

我们先从一个日常场景出发。

设想你正身处一个嘈杂的招聘会，远处有人呼喊你的名字，你会本能地转头寻找声源方向。事实上，你的两只耳朵就构成了一组最天然的"传感器阵列"，而大脑则在无意识间完成了一次方向估计：它依据声音到达左右耳之间的微小时间差，快速判断出声源的大致位置。将这种生物本能转化为工程技术，正是 DOA 估计所做的事情。用更正式的表述来说，DOA 估计是指利用空间分布的传感器阵列，估计信号源从哪个方向到达接收端的过程。

导读示意图

为什么这个问题重要

因为在现代科技体系中，"知道目标在哪里"是让系统能够智能运作的前提，是后续感知、跟踪与决策的基础。DOA 估计技术在过去五十余年间得到了广泛而深入的研究，它的应用几乎贯穿当代电子与信息工程的各个领域：

雷达系统：无论是追踪空中飞行目标，还是智能驾驶汽车中毫米波雷达的障碍物定位，都依赖对目标方向的实时估计。
无线通信：在 5G 乃至未来的 6G 系统中，基站需要知道用户终端的确切方位，才能将信号像聚光灯一样精准"照射"过去——这被称为波束成形（Beamforming），可以有效减少干扰、成倍提升频谱效率。
声学与声呐：海底地形测绘、潜艇水下导航，乃至智能音箱的声源定位与语音增强，背后都有 DOA 估计的身影。

这些应用场景看起来差异很大，但底层的技术问题却是高度一致的：给定阵列接收到的多通道观测数据，如何准确恢复信号的空间方向信息。

导读示意图

为什么这个问题不简单

有些同学可能会想：既然原理上不就是测量一个时间差、换算成角度吗，能有多难？这个直觉在理想条件下是成立的，但现实物理世界往往远比想象中复杂。

真正困难的地方在于，我们能直接拿到的并不是"方向"，而是传感器记录下来的原始观测数据。这些数据通常带有噪声，可能包含多个信号源的混叠结果，空间方向信息也不会直接"写"在数据表面——它隐藏在不同阵元之间的结构差异之中，需要通过数学方法去挖掘和还原。

具体来说，DOA 估计在实际中会面临以下几类典型困难：

第一，观测数据含有噪声。 实际系统中普遍存在热噪声、环境干扰与建模误差。方向信息往往是被噪声污染之后的弱结构，如何在噪声中稳健地提取信号特征，是算法设计的核心挑战之一。

第二，信号源可能不止一个。 多个信号源同时入射时，阵列接收到的是它们的叠加混合结果。系统不仅需要判断"有没有目标"，还需要判断"有几个目标、各自来自哪个方向"——后者往往更加困难。

第三，相邻目标可能非常接近。 如果两个信号源的入射角度十分相近，它们在阵列上产生的响应也会高度相似。这就引出了 DOA 估计中最核心的概念之一：分辨率，即算法区分角度相近的多个信号源的能力。

第四，真实场景往往不满足理想假设。 例如，多径传播会导致同一信号从多个方向重复到达阵列，形成相干信号；阵元位置误差、快拍数不足等因素同样会使估计性能下降。工程实现中，如何处理这些非理想情况，是从算法走向系统的关键一步。

所以你看，DOA 估计并不是简单地"算一个角度"，而是一个同时涉及信号建模、矩阵运算、统计估计与工程实现的综合性问题。也正因为如此，它才成为阵列信号处理领域几十年来持续活跃的核心研究方向之一。

0.2 课程目标与学习路径说明

🎯 本教程定位

本教程面向具备高等数学、线性代数、信号与系统基础，以及 Python 或 MATLAB 编程能力的本科生，定位是一部快速学习型的开源教程。我们不打算用繁杂的理论推导和教科书式的定义堆叠来淹没读者，而是坚持奥卡姆剃刀原则，力求内容精简、表达清晰、实验可复现。教程的目标不只是让你"看懂算法"，更要让你"能写出代码、跑出结果、理解背后的逻辑"。

本教程的整体学习路径如下图所示，共分为四章，由浅入深，逐步展开。

导读示意图

第一章：DOA估计入门

这一章的任务是建立基础。我们会从阵列观测模型出发，依次介绍均匀线阵（ULA）、远场窄带信号假设、导向矢量、协方差矩阵，以及空间谱的基本概念。这里的重点不是死记公式，而是理解一个核心问题：空间方向信息是如何"进入"阵列观测数据的，后续算法又是如何把它"提取"出来的。

学完这一章，你将能够：

看懂基础阵列观测模型，理解各符号的物理含义；
掌握导向矢量与协方差矩阵的数学结构和直观意义；
知道常规波束成形在做什么，以及其分辨率限制从何而来。

第二章：经典DOA估计算法

这一章进入经典算法的核心地带。内容包括：特征值分解与子空间思想、信源数估计与模型阶数选择、MUSIC 算法、ESPRIT 算法、自适应波束形成中的 Capon/MVDR，以及相干信号条件下的空间平滑处理方法。

读者朋友们不必担心这些算法听起来很陌生——我们的目标不是记住几个名字，而是理解它们背后共同的逻辑：如何利用阵列数据的矩阵结构，把一个信号处理问题转化为一个可计算的代数问题。

学完这一章，你将能够：

理解子空间方法的基本思想和信号子空间与噪声子空间的区别；
独立实现 MUSIC、ESPRIT 与 Capon/MVDR 的基础版本；
初步分析不同算法在信噪比、快拍数和信源间隔变化下的性能表现。

第三章：基于深度学习的DOA估计

这一章面向没有系统深度学习基础的读者，目标是以最低的必要成本进入基于深度学习的 DOA 估计世界。内容将从一个补充性质的深度学习基础速览开始，随后回答“为什么要引入深度学习”“任务该如何定义”“数据集如何构建”，再依次展开分类方法、直接角度回归、伪空间谱回归、代码框架实现，以及与经典方法的对比和进一步的深度展开思路。

需要说明的是，第三章并不会把自己写成一门深度学习课程，所有内容都始终围绕一个核心问题展开：如何把 DOA 估计这个物理问题，转化为一个可训练、可验证、可与经典方法比较的学习任务。

学完这一章，你将能够：

理解为什么深度学习会被引入 DOA 估计，以及它和经典方法的问题设定差异；
知道数据集、标签和输入特征应如何构建，并区分类别、直接角度回归和伪空间谱回归三类主流路线；
看懂一个基础的深度学习 DOA 代码框架，并理解其与经典方法的联系、差异与适用场景。

第四章：论文复现和工程实践

最后一章将把前面的知识进一步引向工程场景。内容包括：一篇深度学习 DOA 论文的复现实验、FMCW 毫米波雷达信号处理的基本流程、车载毫米波雷达的实测数据验证，以及两个更偏方法论的拓展主题：深度学习 DOA 估计里的 Sim2Real 问题和无监督 DOA 估计方法。

这一章的重点，不只是"把代码跑通"。我们更希望帮助读者建立一种工程视角：DOA 算法在真实系统中只是信号处理链路的一个环节，它的表现会受到前端信号质量、处理流程设计和实际环境条件的共同影响。仿真好不代表实测好，这个差距值得认真对待；而 Sim2Real 与无监督方法这两个拓展主题，则进一步提醒我们：真正困难的问题，往往出现在“训练条件”和“部署条件”不一致、或“高质量标签”难以获得的时候。

学完这一章，你将能够：

理解 DOA 估计在毫米波雷达完整处理流程中所处的位置与作用；
初步完成一篇相关论文的复现或改写实验；
对仿真结果与实测结果之间的差异形成基本的判断能力，并初步认识 Sim2Real 与无监督学习在 DOA 估计中的现实意义。

🧭 本教程适合谁

适合人群	不适合人群
具备线性代数、Python/MATLAB 基础的本科生	只想查阅深奥数学证明的理论研究者
希望快速上手工程实践的初学者	已经精通阵列信号处理的高级工程师
对 AI 与信号处理交叉领域感兴趣的同学	寻找大而全教科书的读者

✦ 读完本教程后，你将具备：

定义问题的能力：能清晰说明 DOA 估计的物理背景、技术难点与主要方法脉络。
算法实现能力：能独立编写并运行经典方法与深度学习方法的 DOA 代码。
工程复现能力：能理解论文思路，并在仿真或实测数据上完成验证实验。

通过这条学习路径，你将从一个只具备基础数学和编程知识的初学者，逐步成长为能够独立实现、分析甚至改进 DOA 算法的研究萌新。

0.1 DOA估计的应用背景与核心问题​

为什么这个问题重要​

为什么这个问题不简单​

0.2 课程目标与学习路径说明​

第一章：DOA估计入门​

第二章：经典DOA估计算法​

第三章：基于深度学习的DOA估计​

第四章：论文复现和工程实践​

0.1 DOA估计的应用背景与核心问题

为什么这个问题重要

为什么这个问题不简单

0.2 课程目标与学习路径说明

第一章：DOA估计入门

第二章：经典DOA估计算法

第三章：基于深度学习的DOA估计

第四章：论文复现和工程实践