CDF累积分布函数
CDF累积分布函数
概念
累积分布函数(Cumulative Distribution Function, CDF)是概率论和统计学中的一个重要概念。对于一个随机变量 X X X,其累积分布函数 F ( x ) F(x) F(x) 给出了 X X X 小于或等于某个值 x x x 的概率。换句话说,CDF 描述了随机变量的概率分布的累积概率。
具体地,给定一个随机变量 X X X,其累积分布函数 F ( x ) F(x) F(x) 定义为:
F ( x ) = P ( X ≤ x ) F(x) = P(X \leq x) F(x)=P(X≤x)
性质
- 非递减性:累积分布函数是单调非递减的函数。
- 值域:累积分布函数的值域是 [ 0 , 1 ] [0, 1] [0,1]。
- 边界条件:
- F ( x ) F(x) F(x) 在 x x x 趋近于负无穷时趋近于0,即 lim x → − ∞ F ( x ) = 0 \lim_{x \to -\infty} F(x) = 0 limx→−∞F(x)=0。
- F ( x ) F(x) F(x) 在 x x x 趋近于正无穷时趋近于1,即 lim x → ∞ F ( x ) = 1 \lim_{x \to \infty} F(x) = 1 limx→∞F(x)=1。
- 右连续性:累积分布函数是右连续的,即对于任何 x x x, lim ϵ → 0 + F ( x + ϵ ) = F ( x ) \lim_{\epsilon \to 0^+} F(x + \epsilon) = F(x) limϵ→0+F(x+ϵ)=F(x)。
示例
以下是几种常见分布的累积分布函数:
-
正态分布(Normal Distribution):
- 累积分布函数: F ( x ) = 1 2 [ 1 + erf ( x − μ σ 2 ) ] F(x) = \frac{1}{2} \left[ 1 + \operatorname{erf} \left( \frac{x - \mu}{\sigma \sqrt{2}} \right) \right] F(x)=21[1+erf(σ2x−μ)]
- 其中, erf \operatorname{erf} erf是误差函数, μ \mu μ 是均值, σ \sigma σ 是标准差。
-
指数分布(Exponential Distribution):
- 累积分布函数: F ( x ) = 1 − exp ( − λ x ) F(x) = 1 - \exp(-\lambda x) F(x)=1−exp(−λx),其中 λ \lambda λ 是速率参数。
-
威布尔分布(Weibull Distribution):
- 累积分布函数: F ( x ) = 1 − exp ( − ( x λ ) k ) F(x) = 1 - \exp\left(-\left(\frac{x}{\lambda}\right)^k\right) F(x)=1−exp(−(λx)k)
- 其中, λ \lambda λ 是尺度参数, k k k 是形状参数。
如何计算和使用 CDF
使用 scipy
库可以方便地计算和使用累积分布函数。以下是一个具体的例子,展示如何计算正态分布和威布尔分布的 CDF。
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
# 生成一些数据点
x = np.linspace(-3, 3, 1000)
# 正态分布的参数
mu, sigma = 0, 1
# 计算正态分布的 CDF
cdf_normal = stats.norm.cdf(x, loc=mu, scale=sigma)
# 威布尔分布的参数
shape, scale = 1.5, 1
# 计算威布尔分布的 CDF
cdf_weibull = stats.weibull_min.cdf(x, c=shape, scale=scale)
# 绘制 CDF 图像
plt.figure(figsize=(10, 6))
plt.plot(x, cdf_normal, label='Normal CDF')
plt.plot(x, cdf_weibull, label='Weibull CDF')
plt.xlabel('x')
plt.ylabel('CDF')
plt.title('Cumulative Distribution Functions')
plt.legend()
plt.grid()
plt.show()
运行这段代码,将得到正态分布和威布尔分布的累积分布函数图像。可以看到,CDF 描述了每个值以下的累积概率。
结论
累积分布函数是描述随机变量在某个值以下的概率的函数。它在统计学和概率论中有广泛的应用,通过累积分布函数,可以得到随机变量的分布信息,并利用其进行各种概率计算和统计推断。
更多推荐
所有评论(0)