概述
概率密度函数(pdf)
随机变量
X
X
X的高斯分布的概率密度函数(probability density function,pdf):
f
(
x
)
=
1
2
π
σ
e
−
(
x
−
μ
)
2
2
σ
2
,
−
∞
<
x
<
∞
f(x)=frac{1}{sqrt{2pi}sigma}e^{-frac{(x-mu)^{2}}{2sigma^{2}}},-infty<x<infty
f(x)=2πσ1e−2σ2(x−μ)2,−∞<x<∞
其中
μ
,
σ
(
σ
>
0
)
mu,sigma(sigma>0)
μ,σ(σ>0)为常数,记为
X
∼
N
(
μ
,
σ
)
Xsim N(mu,sigma)
X∼N(μ,σ)
累计分布函数(cdf)
高斯分布的累积分布函数(Cumulative distribution function,cdf)为:
F
(
x
)
=
1
2
π
σ
∫
−
∞
x
e
−
(
t
−
μ
)
2
2
σ
2
d
t
F(x)=frac{1}{sqrt{2pi}sigma}int_{-infty}^{x}e^{-frac{(t-mu)^{2}}{2sigma^{2}}}dt
F(x)=2πσ1∫−∞xe−2σ2(t−μ)2dt
求的为高斯分布的曲线在
X
<
x
X<x
X<x下的面积,也就是概率
P
{
X
<
x
}
P{X<x}
P{X<x}。
特别的,如果
X
∼
N
(
0
,
1
)
Xsim N(0,1)
X∼N(0,1)服从标准高斯分布,则
F
(
x
)
F(x)
F(x)记为
Φ
(
x
)
Phi(x)
Φ(x):
Φ
(
x
)
=
1
2
π
σ
∫
−
∞
x
e
−
t
2
2
d
t
Phi(x)=frac{1}{sqrt{2pi}sigma}int_{-infty}^{x}e^{-frac{t^{2}}{2}}dt
Φ(x)=2πσ1∫−∞xe−2t2dt
引理:若
X
∼
N
(
μ
,
σ
2
)
Xsim N(mu,sigma^{2})
X∼N(μ,σ2),则
Z
=
X
−
μ
σ
∼
N
(
0
,
1
)
Z=frac{X-mu}{sigma}sim N(0,1)
Z=σX−μ∼N(0,1)
于是,若
X
∼
N
(
μ
,
σ
2
)
Xsim N(mu,sigma^{2})
X∼N(μ,σ2),其分布函数可以写为
F
(
x
)
=
P
(
X
<
x
)
=
P
(
X
−
μ
σ
<
x
−
μ
σ
)
=
Φ
(
x
−
μ
σ
)
F(x)=P(X<x)=P(frac{X-mu}{sigma}<frac{x-mu}{sigma})=Phi(frac{x-mu}{sigma})
F(x)=P(X<x)=P(σX−μ<σx−μ)=Φ(σx−μ)
期望
根据连续性概率密度函数的期望的定义:
E
(
X
)
=
∫
−
∞
∞
x
f
(
x
)
d
x
E(X)=int_{-infty}^{infty}xf(x)dx
E(X)=∫−∞∞xf(x)dx
∫
−
∞
∞
x
f
(
x
)
d
x
=
∫
−
∞
∞
x
1
2
π
σ
e
−
(
x
−
μ
)
2
2
σ
2
d
x
=
∫
−
∞
∞
(
x
−
μ
+
μ
)
1
2
π
σ
e
−
(
x
−
μ
)
2
2
σ
2
d
x
=
∫
−
∞
∞
(
x
−
μ
)
1
2
π
σ
e
−
(
x
−
μ
)
2
2
σ
2
d
x
+
∫
−
∞
∞
μ
1
2
π
σ
e
−
(
x
−
μ
)
2
2
σ
2
d
x
=
−
σ
2
∫
−
∞
∞
1
2
π
σ
e
−
(
x
−
μ
)
2
2
σ
2
d
(
−
(
x
−
μ
)
2
2
σ
2
)
+
μ
∫
−
∞
∞
1
2
π
σ
e
−
(
x
−
μ
)
2
2
σ
d
x
=
−
σ
2
π
σ
e
−
(
x
−
μ
)
2
2
σ
2
∣
−
∞
∞
+
μ
F
(
∞
)
int_{-infty}^{infty}xf(x)dx=int_{-infty}^{infty}xfrac{1}{sqrt{2pi}sigma}e^{-frac{(x-mu)^{2}}{2sigma^{2}}}dx \=int_{-infty}^{infty}(x-mu+mu)frac{1}{sqrt{2pi}sigma}e^{-frac{(x-mu)^{2}}{2sigma^{2}}}dx \=int_{-infty}^{infty}(x-mu)frac{1}{sqrt{2pi}sigma}e^{-frac{(x-mu)^{2}}{2sigma^{2}}}dx+int_{-infty}^{infty}mufrac{1}{sqrt{2pi}sigma}e^{-frac{(x-mu)^{2}}{2sigma^{2}}}dx\ =-sigma^{2}int_{-infty}^{infty}frac{1}{sqrt{2pi}sigma}e^{-frac{(x-mu)^{2}}{2sigma^{2}}}d(-frac{(x-mu)^{2}}{2sigma^{2}})+muint_{-infty}^{infty}frac{1}{sqrt{2pi}sigma}e^{-frac{(x-mu)^{2}}{2sigma}}dx\ =frac{-sigma}{sqrt{2pi}sigma}e^{-frac{(x-mu)^{2}}{2sigma^{2}}}|_{-infty}^{infty}+mu F(infty)
∫−∞∞xf(x)dx=∫−∞∞x2πσ1e−2σ2(x−μ)2dx=∫−∞∞(x−μ+μ)2πσ1e−2σ2(x−μ)2dx=∫−∞∞(x−μ)2πσ1e−2σ2(x−μ)2dx+∫−∞∞μ2πσ1e−2σ2(x−μ)2dx=−σ2∫−∞∞2πσ1e−2σ2(x−μ)2d(−2σ2(x−μ)2)+μ∫−∞∞2πσ1e−2σ(x−μ)2dx=2πσ−σe−2σ2(x−μ)2∣−∞∞+μF(∞)
若求解区间为
(
−
∞
,
∞
)
(-infty,infty)
(−∞,∞),则期望
E
(
X
)
=
0
+
μ
=
μ
E(X)=0+mu=mu
E(X)=0+μ=μ
若求解区间为
(
−
∞
,
0
)
(-infty,0)
(−∞,0),则为计算条件期望
E
(
X
∣
X
<
0
)
=
∫
−
∞
0
x
f
(
x
)
d
x
F
(
0
)
=
∫
−
∞
0
x
f
(
x
)
d
x
∫
−
∞
0
f
(
x
)
d
x
=
−
σ
2
π
σ
e
−
μ
2
2
σ
2
+
μ
Φ
(
0
−
μ
σ
)
Φ
(
0
−
μ
σ
)
=
μ
+
−
σ
2
π
σ
Φ
(
0
−
μ
σ
)
e
−
μ
2
2
σ
2
E(X|X<0)=frac{int_{-infty}^{0}xf(x)dx}{F(0)}=frac{int_{-infty}^{0}xf(x)dx}{int_{-infty}^{0}f(x)dx} \=frac{frac{-sigma}{sqrt{2pi}sigma}e^{-frac{mu^{2}}{2sigma^{2}}}+muPhi(frac{0-mu}{sigma})}{Phi(frac{0-mu}{sigma})}\=mu+frac{-sigma}{sqrt{2pi}sigma Phi(frac{0-mu}{sigma})}e^{-frac{mu^{2}}{2sigma^{2}}}
E(X∣X<0)=F(0)∫−∞0xf(x)dx=∫−∞0f(x)dx∫−∞0xf(x)dx=Φ(σ0−μ)2πσ−σe−2σ2μ2+μΦ(σ0−μ)=μ+2πσΦ(σ0−μ)−σe−2σ2μ2
scipy库对高斯分布的使用
参考文档:https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.norm.html
这里介绍3个常用的函数:
pdf(x, loc=0, scale=1):x的概率密度函数值
cdf(x, loc=0, scale=1):x的累计分布函数值
ppf(q, loc=0, scale=1):对cdf的反转的,累计分布函数值对应的x
from scipy.stats import norm
print(norm.pdf(0)) # f(0)=0.3989422804014327
print(norm.cdf(0)) # F(0)=0.5
print(norm.ppf(0.5)) # F_inverse(0.5)=0
最后
以上就是炙热钢笔为你收集整理的高斯分布基础知识及scipy实现的全部内容,希望文章能够帮你解决高斯分布基础知识及scipy实现所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复