引言
概率密度(Probability Density)是统计学中十分重要的概念之一,其应用广泛;功率谱密度(power spectral density, PSD)则在电子电气行业用得比较多。 在基于雷达的目标检测中:概率密度和功率谱密度对于我们研究噪声、杂波乃至目标RCS的分布,求解虚警率、检出率、验证模型等方面有十分重要的作用。 本文立足雷达目标检测,对这两个概念做一点梳理和探讨。后续随着课题研究的深入,我将不定期丰富相关内容。
Blog
2024.11.13 博文第一次写作
目录
引言
目录
一、概率密度、功率谱密度相关概念梳理
二、对前述相关概念的仿真探讨
2.1 概率密度(概率分布)与累积分布函数
2.2 功率谱与功率谱密度
三、总结
四、参考资料
五、代码
一、概率密度、功率谱密度相关概念梳理
这两概念的理解有点绕,不过也不难理解:
1、概率密度:以掷骰子为例,对概率密度相关的概念做个梳理:每个骰子有六个面,则随机变量X(表示每次掷时出现的面,这是一个典型的离散型随机变量),变量的取值可以是数字1->6,每掷一次,得到其中一个面的概率都是1/6。
说概率密度前,先对更简单的概率分布、累积分布函数做介绍:概率分布是指随机变量在某个取值下的概率(这个概念针对的是离散型随机变量:我们可以列表给出变量在特定值下的概率是多少)。 进一步地,我们定义随机变量的累积分布函数为:随机变量的取值小于或等于某个特定值的概率的函数(假定为F(x))。 而概率密度是描述随机变量在某个取值范围内发生的概率与该范围对应的长度之间的比值(该概念是面向连续型随机变量),我们对概率密度函数f(x)的定义是:1.非负;2.在定义域上的积分为1; 3. 对于任意实数区间[a, b],随机变量在该区间内取值的概率P满足:
(1-1)
比如在上面掷色子的例子里:对于概率分布,我们有P(X = 1) = 1/6; 对于分布函数,我们有 F(2) = P(X=1)+P(X=2) = 2/6; 对于概率密度(比较牵强地),我们有f(2~3) = (1/6 + 1/6)/2 = 1/6。
此外,对上面的概念做更深入的探讨:
1、不难理解的是:我们对变量整个取值范围内的概率分布进行求和(针对离散变量),其值为1。
2、对于概率密度函数:如果我们对某个取值范围内的概率密度进行积分(针对连续变量),得到的就是变量在这个区间内的概率。推广到全范围,对概率密度函数(PDF)在整个取值范围内进行求和或积分,得到的概率值必然也为1。但同时,需要注意的是:对于连续变量,其在某个确定的点处的概率是0!(如果我们尝试计算一个点的概率,这相当于计算概率密度函数在一个点(没有宽度或长度的数学抽象)下的面积或体积,这自然是0。) 概率密度函数在特定点处的函数值表征的是在该点附近取值的概率。
3、事实上,累积分布函数求导得到的就是概率密度函数,概率密度函数求积分得到的就是累积分布函数。 对于连续随机变量X的累积分布函数F(x),如果存在非负可积函数f(x),使得对任意实数x,有
(1-2)
式中,f(t)就是概率密度函数。
2、功率谱密度:先给功率谱做个介绍(很多情况下我们将这两个概念等价了):功率谱是指信号在频域的功率分布情况,表征的是信号中各个频率分量的功率值,我们对信号做FFT后,再整体取20倍的lg得到的就是功率谱了,单位是dBw。 功率谱密度则是信号功率随频率变化的分布密度,表示单位频率间隔内信号的平均功率(单位是dBw/Hz)。一般用功率谱除以一个适当的系数(采样率?)后得到功率谱密度[2]?另外比较本质的定义可以参考[1]的内容。我们需要从信号能量的角度来定义功率谱密度,有点太过复杂了,我们做比较后端的信号处理可能并不需要这么详细和本质的理解…
二、对前述相关概念的仿真探讨
2.1 概率密度(概率分布)与累积分布函数
本次仿真中,我使用Matlab自带的randn函数随机生成一个大小为1*1024的数组(每个值对应一个样本)。(注:randn生成的数据服从标准正态分布)。 随后,从最小样本值到最大样本值等间隔地分成25等份,分别计算样本落在这25个区间的数量,从而计算得到概率密度分布以及累积分布函数对应的曲线。
【在计算机里面我们无法构造连续变量,本章的仿真实践其实是想用这1024个样本来近似一个连续变量的取值。事实上这1024个样本构成的是一个离散变量,假设1024个样本之间没有相等的两个值,那么从上文我们对概率分布的论述来看,变量取每个值的概率都是1/1024,但是这样计算没有意义(我们无法获取变量的分布情况),就像在前面说的,对于连续变量来说,单个点处的概率值为0(试想假设我们生成的样本无穷大,那单个样本的概率不就是0吗?)。这里划分间隔从某种程度上是进一步地离散化样本:我们通过计算变量落在各个区间内的样本数来获取变量处在“特定位置(事实上是特定区间)”的“概率密度”,这也是我们对概率密度的定义】
得到的仿真结果如下:
图2.1 所随机生成的样本分布情况
图2.2 变量的概率密度分布
图2.3 变量的累积分布函数对应的曲线
结果是符合预期的:首先,图2.2很近似正态分布,这是和randn函数可以产生正态分布的数据这点相验证的。其次,虽然没有定量地分析,但是从图2.3和图2.2的趋势来看,是符合我们之前的结论:累积分布函数求导得到的就是概率密度函数,概率密度函数求积分得到的就是累积分布函数。
虽然Matlab有自带的fitdist函数也可用来做数据分布的拟合以及求解概率密度分布。但是本节给出了一种一般性的:概率密度和累积分布函数的求解流程和方法,读者可以参考后文提供的代码对各类数据做分析。
2.2 功率谱与功率谱密度
本节仿真所用的信号参数列表如下:
表2.1 信号参数列表
采样率(fs) | 100Hz (IQ两路采样) |
采样点数 | 512 |
信号 | 频点:fs/3、 fs/3*2; 幅值都为1,起始相位都为0 |
噪声 | SNR=15dB 的高斯白噪声 |
得到的结果如下:
图2.4 所生成的信号时域
图2.5 所生成信号的频域
图2.6 所生成信号的功率谱和功率谱密度
如前所述,功率谱我们通过:对信号做FFT后,再整体取20倍的lg得到,功率谱密度则是在功率谱的基础上减去db(fs)。
三、总结
本文是想探讨概率密度和功率谱密度,首先对相关的概念做了梳理,随后进行了简单的仿真实践。 内容其实是很简单的(不过也有点绕,我也不太清楚我有没有说清楚),由此专门写一篇博文似乎有点滥竽充数之嫌。 这几个概念对于我们后续进行有关目标检测的各类探讨是很重要的!: 概率是我们用来评估雷达检测效果的唯一指标!而我们所倚赖的就是包括噪声、目标、杂波等的概率密度!
四、参考资料
[1] 功率谱: 功率谱密度(PSD)、功率谱-CSDN博客
[2] 信号处理—频域分析(功率谱、功率谱密度)_信号处理psd功率谱密度分析-CSDN博客
五、代码
概率密度与功率谱密度的理解与仿真博文对应的数据和代码资源-CSDN文库