概念

累积分布函数(Cumulative Distribution Function, CDF)是概率论和统计学中的一个重要概念。对于一个随机变量 X X X,其累积分布函数 F ( x ) F(x) F(x) 给出了 X X X 小于或等于某个值 x x x 的概率。换句话说,CDF 描述了随机变量的概率分布的累积概率。

具体地,给定一个随机变量 X X X,其累积分布函数 F ( x ) F(x) F(x) 定义为:

F ( x ) = P ( X ≤ x ) F(x) = P(X \leq x) F(x)=P(Xx)

性质

  1. 非递减性:累积分布函数是单调非递减的函数。
  2. 值域:累积分布函数的值域是 [ 0 , 1 ] [0, 1] [0,1]
  3. 边界条件
    • F ( x ) F(x) F(x) x x x 趋近于负无穷时趋近于0,即 lim ⁡ x → − ∞ F ( x ) = 0 \lim_{x \to -\infty} F(x) = 0 limxF(x)=0
    • F ( x ) F(x) F(x) x x x 趋近于正无穷时趋近于1,即 lim ⁡ x → ∞ F ( x ) = 1 \lim_{x \to \infty} F(x) = 1 limxF(x)=1
  4. 右连续性:累积分布函数是右连续的,即对于任何 x x x lim ⁡ ϵ → 0 + F ( x + ϵ ) = F ( x ) \lim_{\epsilon \to 0^+} F(x + \epsilon) = F(x) limϵ0+F(x+ϵ)=F(x)

示例

以下是几种常见分布的累积分布函数:

  1. 正态分布(Normal Distribution)

    • 累积分布函数: F ( x ) = 1 2 [ 1 + erf ⁡ ( x − μ σ 2 ) ] F(x) = \frac{1}{2} \left[ 1 + \operatorname{erf} \left( \frac{x - \mu}{\sigma \sqrt{2}} \right) \right] F(x)=21[1+erf(σ2 xμ)]
    • 其中, erf ⁡ \operatorname{erf} erf是误差函数, μ \mu μ 是均值, σ \sigma σ 是标准差。
  2. 指数分布(Exponential Distribution)

    • 累积分布函数: F ( x ) = 1 − exp ⁡ ( − λ x ) F(x) = 1 - \exp(-\lambda x) F(x)=1exp(λx),其中 λ \lambda λ 是速率参数。
  3. 威布尔分布(Weibull Distribution)

    • 累积分布函数: F ( x ) = 1 − exp ⁡ ( − ( x λ ) k ) F(x) = 1 - \exp\left(-\left(\frac{x}{\lambda}\right)^k\right) F(x)=1exp((λx)k)
    • 其中, λ \lambda λ 是尺度参数, k k k 是形状参数。

如何计算和使用 CDF

使用 scipy 库可以方便地计算和使用累积分布函数。以下是一个具体的例子,展示如何计算正态分布和威布尔分布的 CDF。

import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

# 生成一些数据点
x = np.linspace(-3, 3, 1000)

# 正态分布的参数
mu, sigma = 0, 1
# 计算正态分布的 CDF
cdf_normal = stats.norm.cdf(x, loc=mu, scale=sigma)

# 威布尔分布的参数
shape, scale = 1.5, 1
# 计算威布尔分布的 CDF
cdf_weibull = stats.weibull_min.cdf(x, c=shape, scale=scale)

# 绘制 CDF 图像
plt.figure(figsize=(10, 6))
plt.plot(x, cdf_normal, label='Normal CDF')
plt.plot(x, cdf_weibull, label='Weibull CDF')
plt.xlabel('x')
plt.ylabel('CDF')
plt.title('Cumulative Distribution Functions')
plt.legend()
plt.grid()
plt.show()

运行这段代码,将得到正态分布和威布尔分布的累积分布函数图像。可以看到,CDF 描述了每个值以下的累积概率。

结论

累积分布函数是描述随机变量在某个值以下的概率的函数。它在统计学和概率论中有广泛的应用,通过累积分布函数,可以得到随机变量的分布信息,并利用其进行各种概率计算和统计推断。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐