用Octave计算随机变量的概率密度函数
广告
{{v.name}}
对于连续型随机变量 \(X\),若存在非负可积函数 \(f(x)\),使得对任意实数 \(x\),其分布函数 \(F(x)=P(X\le x)=\int_{-\infty}^x f(t)dt\) 则称 \(f(x)\) 为 \(X\) 的概率密度函数。
核心性质
- 非负性:\(f(x)\ge0\),对任意 \(x\in\mathbb{R}\) 成立;
- 归一性:\(\int_{-\infty}^{+\infty}f(x)dx=1\)(曲线与 \(x\) 轴围成的面积为1);
- 区间概率计算:对任意区间 \([a,b]\),\(P(a<X\le b)=F(b)-F(a)=\int_{a}^b f(x)dx\);
- 单点概率为0:\(P(X=c)=0\)(\(c\) 为任意实数);
- 导数关系:在 \(f(x)\) 的连续点处,\(F'(x)=f(x)\)(这是由分布函数求密度函数的核心依据)。
计算概率密度函数的3种核心场景
1. 已知随机变量服从常见分布 → 直接套用公式
若已知连续型随机变量 \(X\) 服从某一常见分布(如均匀、正态、指数分布),可直接写出其概率密度函数,无需额外计算。
常见连续分布的概率密度函数速查表:
| 分布类型 | 分布参数 | 概率密度函数 \(f(x)\) | 适用范围 |
|----------|----------|---------------------|----------|
| 均匀分布 \(U(a,b)\) | \(a < b\) | \(f(x)=\begin{cases}\frac{1}{b-a}, & a\le x\le b \\ 0, & \text{其他}\end{cases}\) | \(x\in\mathbb{R}\) |
| 正态分布 \(N(\mu,\sigma^2)\) | \(\mu\in\mathbb{R},\sigma>0\) | \(f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2} }\) | \(x\in\mathbb{R}\) |
| 指数分布 \(E(\lambda)\) | \(\lambda>0\) | \(f(x)=\begin{cases}\lambda e^{-\lambda x}, & x>0 \\ 0, & x\le0\end{cases}\) | \(x\in\mathbb{R}\) |
例子:若 \(X \sim N(2,4)\),则 \(\mu=2,\sigma=2\),其概率密度函数为 \(f(x)=\frac{1}{2\sqrt{2\pi} }e^{-\frac{(x-2)^2}{8} }\)
2. 已知分布函数 $F(x)$ → 求导得到概率密度函数
由概率密度与分布函数的导数关系,在 \(F(x)\) 可导的区间内,直接对分布函数求导即可得到概率密度函数;在 \(F(x)\) 不可导的点(如分段点),\(f(x)\) 的取值不影响积分结果,通常定义为0。
计算步骤
1. 明确分布函数 \(F(x)\) 的分段表达式;
2. 对每一段可导区间,计算 \(f(x)=F'(x)\);
3. 整合各段结果,得到完整的概率密度函数。
例子: 已知连续型随机变量 \(X\) 的分布函数为 \( F(x)= \begin{cases} 0, & x < 0 \\ \frac{x^2}{2}, & 0 \le x < 1 \\ 2x - \frac{x^2}{2} - 1, & 1 \le x < 2 \\ 1, & x \ge 2 \end{cases} \) 求其概率密度函数 \(f(x)\)。
解:对 \(F(x)\) 分段求导 - 当 \(x < 0\) 时:\(f(x)=F'(x)=0\); - 当 \(0 < x < 1\) 时:\(f(x)=F'(x)=x\); - 当 \(1 < x < 2\) 时:\(f(x)=F'(x)=2 - x\); - 当 \(x \ge 2\) 时:\(f(x)=F'(x)=0\); - 在分段点 \(x=0,1,2\) 处,定义 \(f(x)=0\)(不影响积分)。
最终概率密度函数为 \( f(x)= \begin{cases} x, & 0 < x < 1 \\ 2 - x, & 1 < x < 2 \\ 0, & \text{其他} \end{cases} \)
3. 已知随机变量函数 \(Y=g(X)\) → 由 \(X\) 的密度推导 \(Y\) 的密度
若已知 \(X\) 的概率密度函数 \(f_X(x)\),且 \(Y=g(X)\) 是单调可导函数,可通过变量替换法推导 \(Y\) 的概率密度函数 \(f_Y(y)\)。
核心公式(单调函数情形)
设 \(y=g(x)\) 严格单调、可导,其反函数为 \(x=h(y)\),且 \(h'(y)\) 存在,则 \( f_Y(y)= \begin{cases} f_X(h(y))\cdot |h'(y)|, & y\in g(\mathbb{R}) \\ 0, & \text{其他} \end{cases} \) 其中 \(g(\mathbb{R})\) 是函数 \(g(x)\) 的值域。
例子:已知 \(X\sim U(0,1)\) ,概率密度 \(f_X(x)=\begin{cases}1, & 0<x<1 \\ 0, & \text{其他}\end{cases}\),求 \(Y=2X+1\) 的概率密度函数。
解:
1. 确定函数单调性:\(y=2x+1\) 在 \((0,1)\) 上严格单调递增;
2. 求反函数:\(x=h(y)=\frac{y-1}{2}\),导数 \(h'(y)=\frac{1}{2}\);
3. 确定 \(Y\) 的值域:当 \(x\in(0,1)\) 时,\(y\in(1,3)\);
4. 代入公式计算: $$ f_Y(y)=f_X\left(\frac{y-1}{2}\right)\cdot\left|\frac{1}{2}\right| $$ - 当 \(1<y<3\) 时:\(\frac{y-1}{2}\in(0,1)\),\(f_X\left(\frac{y-1}{2}\right)=1\),故 \(f_Y(y)=1\times\frac{1}{2}=\frac{1}{2}\); - 当 \(y\le1\) 或 \(y\ge3\) 时:\(f_Y(y)=0\)。
最终 \(Y\) 的概率密度函数为 \( f_Y(y)= \begin{cases} \frac{1}{2}, & 1<y<3 \\ 0, & \text{其他} \end{cases} \)
程序代码如下
>> pkg load symbolic
>> y = sym('y');
>> diff((y - 1) / 2, y)
ans = (sym) 1/2
关键注意事项
1. 离散型随机变量无概率密度函数:离散型随机变量的概率规律用分布律 \(P(X=x_i)=p_i\) 描述,不能用概率密度函数;
2. 概率密度函数的取值可以大于1:概率密度函数本身不代表概率,只有积分后才是概率,例如均匀分布 \(U(0,0.5)\) 的密度函数 \(f(x)=2>1\);
3. 分段函数的处理:概率密度函数常为分段函数,计算时需严格按区间分段,避免遗漏或混淆区间范围。
友链