本文最后更新于 2024-01-13T12:30:15+00:00
概率论与数理统计
高数预备知识
∫−∞+∞e−x2dx=π
伽马函数
Γ(α)=∫0+∞xα−1e−xdx=(α−1)Γ(α−1)
Γ(21)=π
贝塔函数(p>0,q>0)
B(p,q)=Γ(p+q)Γ(p)Γ(q)=∫01xp−1(1−x)q−1dx
分布函数
0-1分布
X∼b(1,p)
P{X=k}=pk(1−p)1−k,k=0,1
E(X)=p
D(X)=p(1−p)
二项分布
X∼b(n,p)
P{X=k}=Cnkpk(1−p)n−k,k=0,1,...,n
E(X)=np
D(X)=np(1−p)
泊松分布
X∼π(λ)
P{X=k}=k!λke−λ,k=0,1,2,...
E(X)=λ
D(X)=λ
均匀分布
X∼U(a,b)
f(x)=⎩⎨⎧b−a10,b<x<a,else
E(X)=2a+b
D(X)=12(b−a)2
指数分布
f(x)=⎩⎨⎧θ1e−θx0,x>0,else
E(X)=θ
D(X)=θ2
正态分布
X∼N(μ,σ2)
f(x)=2πσ1e−2σ2(x−μ)2
E(X)=μ
D(X)=σ2
抽样分布
卡方分布
X1,X2,...,Xn是来自正态总体N(0,1)的样本,则
χ2=X12+X22+...+Xn2∼χ2(n)
若 χ12∼χ2(n1), χ22∼χ2(n2),则
χ12+χ22∼χ2(n1+n2)
若 χ2∼χ2(n1), 则
E(χ2)=n
D(χ2)=2n
上分位数
P{χ2>χα2(n)}=α
t分布
X∼N(0,1), Y∼χ2(n),且X和Y相互独立,则:
nYX∼t(n)
上分位数
P{t>tα(n)}=α
t1−α(n)=−tα(n)
F分布
U∼χ2(n1), V∼χ2(n2),且U和V相互独立,则:
n2Vn1U∼F(n1,n2)
F1∼F(n2,n1)
上分位数
P{F>Fα(n1,n2)}=α
F1−α(n1,n2)=Fα(n2,n1)1
正态分布的样本均值和样本方差的分布
- X1,X2,...,Xn有相同的均值μ , 方差 σ2,则
E(X)=μ
D(X)=nσ2
E(S2)=σ2
- X1,X2,...,Xn是来自正态总体N(μ,σ2)的样本,则
X∼N(μ,nσ2)
σ2(n−1)S2∼χ2(n−1)
X和S2相互独立
nSX−μ∼t(n−1)
- X1,X2,...,Xn1是来自正态总体N(μ1,σ12)的样本, Y1,Y2,...,Yn2是来自正态总体N(μ2,σ22)的样本, 两个样本相互独立,则
两个样本的平均值:
X=n11i=1∑n1Xi
Y=n21i=1∑n2Yi
两个样本的样本方差
S12=n1−11i=1∑n1(Xi−X)2
S22=n2−11i=1∑n2(Yi−Y)2
满足以下性质
σ22σ12S22S12∼F(n1−1,n2−1)
当σ12=σ22=σ2时,
SWn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2)
其中
SW2=n1+n2−2(n1−1)S12+(n2−1)S22
正态总体均值、方差的置信区间与单侧置信限
(置信水平为1−α)
单个正态总体
估计μ,已知σ2
根据
σX−μn∼N(0,1)
置信区间
(X−nσz2α,X+nσz2α)
置信上界
μ=X+nσzα
置信下界
μ=X−nσzα
估计μ,未知σ2
根据
SX−μn∼t(n−1)
置信区间
(X−nSt2α(n−1),X+nSt2α(n−1))
置信上界
μ=X+nStα(n−1)
置信下界
μ=X−nStα(n−1)
估计σ2,未知μ
根据
σ2(n−1)S2∼χ2(n−1)
置信区间
(χ2α2(n−1)(n−1)S2,χ1−2α2(n−1)(n−1)S2)
置信上界
σ2=χ1−α2(n−1)(n−1)S2
置信下界
σ2=χα2(n−1)(n−1)S2
两个正态总体
估计μ1−μ2,已知σ12和σ22
根据
n1σ12+n2σ22(X−Y)−(μ1−μ2)∼N(0,1)
置信区间
(X−Y−z2αn1σ12+n2σ22,X−Y+z2αn1σ12+n2σ22)
置信上界
μ1−μ2=X−Y+zαn1σ12+n2σ22
置信下界
μ1−μ2=X−Y−zαn1σ12+n2σ22
估计μ1−μ2,未知σ12, σ22,但σ12=σ22=σ2
根据
SWn11+n21(X−Y)−(μ1−μ2)∼t(n1+n2−2)
其中:
SW2=n1+n2−2(n1−1)S12+(n2−1)S22
置信区间
(X−Y−SWn11+n21t2α(n1+n2−2),X−Y+SWn11+n21t2α(n1+n2−2))
置信上界
μ1−μ2=X−Y+SWn11+n21tα(n1+n2−2)
置信下界
μ1−μ2=X−Y−SWn11+n21tα(n1+n2−2)
估计σ22σ12,未知μ1和μ2
根据
σ22σ12S22S12∼F(n1−1,n2−1)
置信区间
(F2α(n1−1,n2−1)S22S12,F1−2α(n1−1,n2−1)S22S12)
置信上界
(σ22σ12)=F1−α(n1−1,n2−1)S22S12
置信下界
(σ22σ12)=Fα(n1−1,n2−1)S22S12
正态总体均值、方差的检验法
(显著性水平为α)
H0为原假设, H1为备择假设
单个正态总体均值的检验
总体X∼N(μ,σ2)
如果方差已知
已知σ2, 检验μ
利用检验统计量
Z=σX−μ0n∼N(0,1)
若H0:μ≤μ0, H1:μ>μ0, 拒绝域为
z=σx−μ0n≥zα
若H0:μ≥μ0, H1:μ<μ0, 拒绝域为
z=σx−μ0n≤−zα
若H0:μ=μ0, H1:μ=μ0, 拒绝域为
∣z∣=∣σx−μ0n∣≥z2α
如果方差未知
未知σ2, 检验μ
利用检验统计量
t=SX−μ0n∼t(n−1)
若H0:μ≤μ0, H1:μ>μ0, 拒绝域为
t=Sx−μ0n≥tα(n−1)
若H0:μ≥μ0, H1:μ<μ0, 拒绝域为
t=Sx−μ0n≤−tα(n−1)
若H0:μ=μ0, H1:μ=μ0, 拒绝域为
∣t∣=∣Sx−μ0n∣≥t2α(n−1)
两个正态总体均值差的检验
如果两个总体方差已知
已知σ12, σ22, 检验μ1−μ2
利用检验统计量
Z=n1σ12+n1σ12X−Y−δ∼N(0,1)
若H0:μ1−μ2≤δ, H1:μ1−μ2>δ, 拒绝域为
z=n1σ12+n1σ12x−y−δ≥zα
若H0:μ1−μ2≥δ, H1:μ1−μ2<δ, 拒绝域为
z=n1σ12+n1σ12x−y−δ≤−zα
若H0:μ1−μ2=δ, H1:μ1−μ2=δ, 拒绝域为
∣z∣=∣n1σ12+n1σ12x−y−δ∣≥z2α
如果两个总体方差未知
未知σ12, σ22,但σ12=σ22=σ2,检验μ1−μ2
利用检验统计量
t=SWn11+n21X−Y−δ∼t(n1+n2−2)
其中
SW2=n1+n2−2(n1−1)S12+(n2−1)S22
若H0:μ1−μ2≤δ, H1:μ1−μ2>δ, 拒绝域为
t=SWn11+n21x−y−δ≥tα(n1+n2−2)
若H0:μ1−μ2≥δ, H1:μ1−μ2<δ, 拒绝域为
t=SWn11+n21x−y−δ≤−tα(n1+n2−2)
若H0:μ1−μ2=δ, H1:μ1−μ2=δ, 拒绝域为
∣t∣=∣SWn11+n21x−y−δ∣≥t2α(n1+n2−2)
正态总体方差的检验
单个总体的情况
检验σ2
利用检验统计量
χ2=σ02(n−1)S2∼χ2(n−1)
若H0:σ2≤σ02, H1:σ2>σ02, 拒绝域为
χ2=σ02(n−1)S2≥χα2(n−1)
若H0:σ2≥σ02, H1:σ2<σ02, 拒绝域为
χ2=σ02(n−1)S2≤χ1−α2(n−1)
若H0:σ2=σ02, H1:σ2=σ02, 拒绝域为
χ2=σ02(n−1)S2≥χ2α2(n−1)
或
χ2=σ02(n−1)S2≤χ1−2α2(n−1)
两个总体的情况
检验σ22σ12
利用检验统计量
F=σ22σ12S22S12∼F(n1−1,n2−1)
若H0:σ12≤σ22, H1:σ12>σ22, 拒绝域为
F=S22S12≥Fα(n1−1,n2−1)
若H0:σ12≥σ22, H1:σ12<σ22, 拒绝域为
F=S22S12≤F1−α(n1−1,n2−1)
若H0:σ12=σ22, H1:σ12=σ22, 拒绝域为
F=S22S12≤F1−2α(n1−1,n2−1)
或
F=S22S12≥F2α(n1−1,n2−1)
基于成对数据的检验
Di=Xi−Yi , i=1,2,...,n
Di∼N(μD,σD2)
利用检验统计量
t=SDD−0n∼t(n−1)
若H0:μD≤0, H1:μD>0, 拒绝域为
t=SDD−0n≥tα(n−1)
若H0:μD≥0, H1:μD<0, 拒绝域为
t=SDD−0n≤−tα(n−1)
若H0:μD=0, H1:μD=0, 拒绝域为
∣t∣=∣SDD−0n∣≥t2α(n−1)