该总结仅基于大连理工大学指定课本,如有遗落本人概不负责 拒绝付费转发
补事件
A−B=A−AB=AB
德摩根律
⋃i=1nAi=⋂i=1nAi⋂i=1nAi=⋃i=1nAi
概率可加性
P(⋃i=1∞Ai)=∑i=1∞P(Ai)其中A1A2...是一列两两互不相容的事件P(⋃i=1nAi)=∑i=1nP(Ai)其中A1A2...An是一列两两互不相容的事件
一些常识
P(∅)=0如果A⊂B,则P(A)≤P(B) 反之不一定成立P(A)+P(A)=1
加减法公式
P(A−B)=P(AB)=P(A)−P(AB)P(A∪B)=P(A)+P(B)−P(AB)P(A∪B∪C)=P(A)+P(B)+P(C)−P(AB)−P(AC)−P(BC)+P(ABC)
古典概型
P(A)=nk 其中k是事件A的样本点数,n是样本总点数
几何概型
P(A)=SΩSA 其中SA是事件A对应的面积,SΩ是总面积
条件概率
P(A∣B)=P(B)P(AB) P(B)>0 B发生情况下A发生的条件概率
乘法公式
P(AB)=P(A)P(B∣A)=P(B)P(A∣B)P(A1A2A3...An)=P(A1)P(A2∣A1)P(A3∣A1A2)...P(An∣A1A2...An−1)
全概率公式
P(B)=∑i=1∞P(Ai)P(B∣Ai) Ai是一个划分
贝叶斯公式
P(Ak∣B)=∑i=1nP(Ai)P(B∣Ai)P(Ak)P(B∣Ak)
独立的判断与性质
P(AB)=P(A)P(B) 与 A、B独立互为充要条件(A,B)、(A,B)、(A,B)、(A,B)四个之中只要有一个独立,其余三个均独立若A与A独立则P(A)=0或1P(A)>0,P(B)>0 AB=∅则A与B独立,二者互为充要条件
从A!,A2,...,An中任取k(2≤k≤n)个事件均满足P(Ai1Ai2...Ain)=P(Ai1)P(Ai2)...P(Ain)
伯努利实验
如果实验E只有两个结果:A和A,并且P(A)=p,P(A)=q,把实验E独立的重复n次构成一个实验,成为n重伯努利实验
分布函数及其性质
F(x)=P(X≤x)F(∞)=1,F(−∞)=0F(x)为x的单调不减函数P(a≤X≤b)=F(b)−F(a−0)P(a<X≤b)=F(b)−F(a)P(a<X<b)=F(b−0)−F(a)P(a≤X<b)=F(b−0)−F(a−0)
二项分布
写作X∼B(n,p)n为实验次数,p为成功概率P(X=k)=Cnkpkqn−k,k=0,1,...,nE(X)=np D(X)=npq=np(1−p)
泊松分布
写作X∼P(λ) λ为参数且大于零P(X=k)=k!λke−λ, k=0,1,...,E(X)=λ D(X)=λ E(X2)=λ2+λ设X,Y相互独立,且分别服从参数为λ1,λ2的泊松分布Z=X+Y有Z∼P(λ1+λ2)
几何分布
写作X∼G(p),P>0P(X=k)=pqk−1=p(1−p)k−1, k=1,2,...,E(X)=p1 D(X)=p2q=p21−p E(X2)=P2q+1P(X>n+m∣X>m)=P(X>n) 几何分布的无记忆性
超几何分布
写作X∼H(n,M,N) N>M,N>nP(X=k)=CNnCMkCN−Mn−k, k=0,1,...,min(M,n)
密度函数及性质
F(x)=∫−∞xf(t)dt,x∈R f(x)即为密度函数0≤f(x) ∫−∞∞f(x)=1P(X=c)=0 c为常数P(a<x<b)=P(a<x≤b)=P(a≤x<b)=P(a≤x≤b)=∫abf(x)dx
均匀分布
写作X∼U(a,b)f(x)=b−a1 x∈(a,b) F(x)=b−ax−a x∈(a,b)E(x)=2a+b E(x2)=3a2+b2+ab D(x)=12(b−a)2
指数分布
写作X∼E(λ)f(x)=λe−λx x>0 F(x)=1−e−λx x>0E(x)=λ1 E(x2)=λ22 D(x)=λ21P(X>t+s∣X>s)=P(X>t) 指数分布的无记忆性
正态分布
写作X∼N(μ,σ2)f(x)=2πσ1e−2σ2(x−μ)2 x∈R将μ=0,σ2=1的正态分布称为标准正态分布,其分布函数写作Φ(x) 密度函数写作ϕ(x)ϕ(x)=2π1e−2x2 Φ(x)=∫−∞xϕ(t)dt若X∼N(μ,σ2),令Z=σX−μ,则Z∼N(0,1)E(x)=μ D(x)=σ2设X1,X2,...,Xn相互独立,且Xi∼N(μi,σi2),i=1,2,...,n那么对于任意常数ai,i=1,2,...,n以及常数c,有i=1∑naiXi+c ∼N(i=1∑naiμi+c,i=1∑nai2σi2) 正态分布的可加性
离散型随机变量函数的分布列
若X∼[x1 x2 x3...p1 p2 p3...] Y=g(X),则Y∼[g(x1) g(x2) g(x3)...p1 p2 p3...]
一个定理
设连续性随机变量X的密度函数为fX(x),y=g(x)是一个严格单调函数,且具有一阶连续导函数,x=h(y)是y=g(x)的反函数,则Y=g(X)的密度函数为fY(y)=fX(h(y))∣h′(y)∣
二维随机变量的联合分布函数及其性质
设二维随机变量(X,Y),对任意实数x,y,二元函数F(x,y)=P(X≤x,Y≤y) 称为(X,Y)的联合分布函数P(x1<X≤x2,y1<Y≤y2)=F(x2,y2)−F(x1,y2)−F(x2,y1)+F(x1,y1)F(x,y)对x或y都是不减函数,即对任意y,若x1≤x2,则F(x1,y)≤F(x2,y),对于任意的x同理F(−∞,y)=0 F(x,−∞)=0 F(−∞,−∞)=0 F(∞,∞)=1F(x+0,y)=F(x,y)=F(x,y+0)
边际分布函数
FX(x)=F(x,∞) FY(y)=F(∞,y)
二维离散型随机变量的独立性
设(X,Y)为二维离散型随机变量,X与Y的可能取值分别为x1,x2,...与y1,y2,...如果对任意的i,j=1,2,...都有P(X=xi,Y=yj)=P(X=xi)P(Y=yj) 则称X与Y是相互独立的
二维离散型随机变量的条件分布列
设(X,Y)为二维离散型随机变量,X与Y的可能取值分别为x1,x2,...与y1,y2,...如果对任意的i,j=1,2,...,称pi∣j=P(X=xi∣Y=yj)=P(Y=yj)P(X=xi,Y=yj)为已知{Y=yj}的条件下X的分布列
二维连续型随机变量及性质
设F(x,y)为二维随机变量(X,Y)的联合分布函数,若存在非负函数f(x,y)使得对于任意的x,y∈R,有F(x,y)=∫−∞x∫−∞yf(u,v)dudv则f(x,y)为(X,Y)的联合概率密度函数f(x,y)≥0 ∫−∞∞∫−∞∞f(x,y)dxdy=1∂x∂y∂2F(x,y)=f(x,y)fX(x)=∫−∞∞f(x,y)dy,x∈R fY(y)=∫−∞∞f(x,y)dx,y∈RfX(x)为X的边际密度函数 fY(y)为Y的边际密度函数
二维均匀分布
D为平面有界闭区域,面积为SD f(x,y)=SD1 (x,y)∈D若G为D的子区域 P((X,Y)∈G)=∬Gf(x,y)dσ=SD1∬Gdσ=SDSG
二维正态分布
写作(X,Y)∼N(μ1,μ2,σ12,σ22,ρ),σ1>0,σ2>0,∣ρ∣<1f(x,y)=2πσ1σ21−ρ21e2(1−ρ2)−1[σ12(x−μ1)2−σ1σ22ρ(x−μ1)(y−μ2)+σ22(y−μ2)2]二维正态分布的两个边缘分布都是一维正态分布,且参数分别为(μ1,σ1)和(μ2,σ2)具有相同的参数μ1,μ2,σ1,σ2,但ρ不同的二维正态分布具有相同的边缘分布函数X与Y相互独立的充要条件是ρ=0设Z=aX+bY、W=cX+dY a b c d均为常数,则(Z,W)也遵从二维正态分布,且Z和W均为一维正态分布
二维连续型随机变量的独立性
若对于所有的x,y有f(x,y)=fX(x)fY(y) 或 F(x,y)=FX(x)FY(y) 则称X和Y相互独立若(X,Y)∼N(μ1,μ2,σ12,σ22,ρ),则X与Y相互独立的充要条件是ρ=0
二维连续性随机变量的条件密度
给定Y=y的条件下X的条件分布函数与条件密度函数FX∣Y(x∣y)=∫−∞xfY(y)f(u,y)du fX∣Y(x∣y)=fY(y)f(x,y)给定X=x的条件下Y的条件分布函数与条件密度函数FY∣X(y∣x)=∫−∞yfX(x)f(x,u)du fY∣X(y∣x)=fX(x)f(x,y)f(x,y)=fX(x)fY∣X(y∣x)=fY(y)fX∣Y(x∣y)
极大极小分布
设随机变量X1,X2,...,Xn相互独立,且Xi的分布函数为FXi(x),i=1,2,...令Y=max{X1,X2,...,Xn} Z=min{X1,X2,...,Xn}Y的分布函数Fmax=i=1∏nFXi(x)Z的分布函数Fmin=1−i=1∏n(1−FXi(x))特别的,如果X1,X2,...,Xn的分布函数相同,有Fmax=F(x)n Fmin=1−(1−F(x))nmax{X,Y}=21(X+Y+∣X−Y∣)min{X,Y}=21(X+Y−∣X−Y∣)
数学期望
EX=k=1∑∞xkpk (离散型随机变量)E(X)=∫−∞∞xf(x)dx (连续型随机变量)设Y=g(X),则E(Y)=k=1∑∞g(xk)pk (X是离散) E(Y)=∫−∞∞g(x)f(x)dx (X是连续)设Z=g(X,Y),f(x,y)为(X,Y)的密度函数则,E(Z)=i=1∑∞j=1∑∞g(xi,yj)pij (Z是离散) E(Z)=∫−∞∞∫−∞∞g(x,y)f(x,y)dxdy (Z是连续)设(X,Y)为二维离散随机变量有 E(X)=i=1∑∞j=1∑∞xipij E(Y)=j=1∑∞i=1∑∞yjpij设(X,Y)为二维连续随机变量,联合概率密度函数为f(x,y)有 E(X)=∫−∞∞∫−∞∞xf(x,y)dxdy E(Y)=∫−∞∞∫−∞∞yf(x,y)dxdyE(c)=c E(cX)=cE(X) c为常数E(X1+X2)=E(X1)+E(X2)若X与Y相互独立,则E(XY)=E(X)E(Y) g(X) h(Y)为X和Y的函数,E[g(x)h(y)]=E[g(x)]E[h(y)]E(XY)=∬[f(x,y)∗x∗y]dxdy
方差
D(X)=E{[E−E(X)]2}=E(X2)−[E(x)]2=σX2D(c)=0 c为常数D(aX+b)=a2D(X) a与b均为常数若X与Y相互独立,有D(X+Y)=D(X)+D(Y)
协方差
Cov(X,Y)=E{[X−E(X)][Y−E(Y)]}=E(XY)−E(X)E(Y)Cov(X,Y)=Cov(Y,X)Cov(X,X)=D(X)Cov(aX,bY)=ab⋅Cov(X,Y)若X与Y相互独立,有Cov(X,Y)=0 反之不成立Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)D(aX+bY)=a2D(X)+b2D(Y)+2ab⋅Cov(X,Y)
相关系数
ρXY=D(X)D(Y)Cov(X,Y)∣ρXY≤1∣当ρXY=1时,存在正整数a与实数b使Y=aX+b(X与Y成正相关) −1时称负相关当ρXY=0时,称X与Y不相关(只指没有线性关系,不代表独立)若(X,Y)遵守二维正态分布,X与Y相互独立的充要条件是ρXY=0
随机变量的标准化
X∗=DXX−EXEX∗=0 DX∗=1ρX,Y=ρX∗,Y∗=EX∗Y∗
矩
设X为一个随机变量,如果E∣X∣k<∞,k=1,2,...,则称EXk为X的k阶原点矩,称E(X−EX)k为X的k阶中心距
协方差矩阵
设X1,X2,...,Xn为n个随机变量,令σij=Cov(Xi,Xj),i,j=1,2,...,n称矩阵∑=(σ)n×n为X1,X2,...,Xn的协方差矩阵协方差矩阵是对称矩阵,是半正定矩阵
切比雪夫不等式
设随机变量X,E(X)=μ D(X)=σ2,对于任意正数ε,有P{∣X−μ∣≥ε}≤ε2σ2P{∣X−μ∣<ε}≥1−ε2σ2
大数定律与中心极限定理
设X1,X2,...,Xn,...是一个随机变量序列,a是一个常数,若对于任意整数ε,有n→∞limP{∣Xn−a∣≥ε}=0或n→∞limP{∣Xn−a∣<ε}=1则称序列X1,X2,...,Xn,...依概率收敛于a,记为Xn→Pa
切比雪夫大数定律
设X1,X2,...,Xn,...是一个相互独立的随机变量序列,每个随机变量都存在有限的方差,且一致有界,即存在常数C,使D(Xi)≤C,则对于任意正数ε,有n→∞limP{∣n1i=1∑nXi−n1i=1∑nE(Xi)∣≥ε}=0
伯努利大数定律
设nA是n重伯努利实验中事件A的出现次数,p是事件A在每次实验中出现的概率,对任意正数ε,有n→∞limP{∣nnA−p≥ε}=0 或 n→∞limP{∣nnA−p<ε}=1
辛钦大数定律
设X1,X2,...,Xn,...是一系列独立同分布的随机变量,且具有数学期望E(Xi)=μ i=1,2,..,n,...,对于任意正数ε有n→∞limP{∣n1i=1∑nXi−μ∣>ε}=0 (即n1i=1∑nXi依概率收敛于μ)
独立同分布的中心极限定理
设X1,X2,...,Xn,...是相互独立同分布的随机变量序列,且E(Xi)=μ D(Xi)=σ2,i=1,2,...,对于∀x∈R,有n→∞limP{nσ∑i=1nXi−nμ≤x}=Φ(x)即n→∞limP((i=1∑nXi)∗≤x)=Φ(x)
棣莫弗-拉普拉斯中心极限定理
设随机变量X是n重伯努利实验中事件A的出现次数,p是事件A在每次实验中出现的概率,对任意实数x,有n→∞limP{np(1−p)X−np≤x}=2π1∫−∞xe−2t2dt=Φ(x)
一些重要的统计量
设X1,X2,...,Xn是从总体X中抽取的样本X=n1i=1∑nxi 样本均值S2=n−11i=1∑n(xi−x)2=n−11(i=1∑nxi2−nX2) 样本方差S=n−11i=1∑n(xi−x)2 样本标准差Ak=n1i=1∑nXik k=1,2,... 样本k阶原点矩X(n)=max{X1,X2,...,Xn} 极大次序统计量X(1)=min{X1,X2,...,Xn} 极小次序统计量
χ2分布
设X1,X2,...,Xn相互独立,且均服从N(0,1),称χ2=X12+X22+...+Xn2 为服从自由度为n的χ2分布,记作χ2(n)若X∼χ2(n),Y∼χ2(m),且X与Y相互独立,则X+Y∼χ2(n+m) χ2分布的可加性若X∼χ2(n),有E[χ2(n)]=n D[χ2(n)]=2n
t分布
设X∼N(0,1),Y∼χ2(n),且X与Y相互独立,称t=Y/nX为服从自由度为n的t分布,记作t(n)当n充分大时,t分布可以近似看做标准正态分布
F分布
设X∼χ2(n),Y∼χ2(m),且X与Y相互独立,称F=Y/mX/n为服从自由度为n,m的F分布,记作F(n,m)t(n)2=F(1,n) F(n,m)=F(m,n)1
单正态总体的抽样分布定理
设总体X∼N(μ,σ2),X1,X2,...,Xn是总体X的简单随机样本,样本均值为X,样本方差为S2,有E(X)=μ D(X)=nσ2E(S2)=σ2 D(S2)=n−12σ4σ/nX−μ∼N(0,1)σ2n−1S2∼χ2(n−1),且X与S2相互独立 σ21i=1∑n(xi−X)2∼χ2(n−1)S/nX−μ∼t(n−1)
双正态总体的抽样分布定理
设总体X∼N(μ1,σ12)与Y∼N(μ2,σ22)相互独立,X1,X2,...,Xn是总体X的简单随机样本,Y1,Y2,...,Ym是总体Y的简单随机样本以1X,Y,S12,S22分别表示两组样本的均值与方差nσ12+mσ22(X−Y)−(μ1−μ2)∼N(0,1)S22S12σ12σ22∼F(n−1,m−1)若σ12=σ22则Swn1+m1(X−Y)−(μ1−μ2)∼t(n+m−2)其中Sw=n+m−2(n−1)S12+(m−1)S22
正态分布的上a分位点
设随机变量Z∼N(0,1),若对a∈(0,1),实数za满足P{Z>za}=a则称za为标准正态分布的上a分位点z1−a=−za Φ(za)=1−a
χ2分布上的a分位点
设随机变量χ2∼χ2(n)若对a∈(0,1),实数χa2(n)满足P{χ2>χa2(n)}=a则称χa2(n)为χ2(n)的上a分位点P{χ2(n)≤χ1−a2(n)}=a
t分布的上a分位点
设随机变量t∼t(n),若对a∈(0,1),实数ta(n)满足P{t>ta(n)}=a则称ta(n)为t(n)分布的上a分位点t1−a(n)=−ta(n)
F分布的上a分位点
设随机变量F∼F(n,m),若对a∈(0,1),实数Fa(n,m)满足P{F>Fa(n,m)}=a则称Fa(n,m)为F(n,m)分布的上a分位点F1−a(n,m)=Fa(m,n)1 P{F(m,n)>Fa(n,m)1}=1−a
连续分布的上a分位点
设随机变量Y为一个连续型随机变量,若对a∈(0,1),实数Ya满足P{Y>Ya}=a则称Ya为Y的上a分位点P{Y>Ya}=a P{Y<Y1−a}=aP{Y<Y1−a/2或Y>Ya/2}=a P{Y<Ya}=1−aP{Y>Y1−a}=1−a P{Y1−a/2<Y<Ya/2}=1−a
矩估计法
即用样本矩替换同阶总体矩,如一阶样本矩A1=n1i=1∑nxi=EX=X=h(θ)对于总体有多个未知数的情况:hi(θ1,θ2,...,θk)=E(Xi)=Ai=n1j=1∑nxji (i=1,2,3,...,k)求解相应的多元方程组就好,若遇到没有意义的方程组只需要继续求更高阶的矩就好对于任意的分布有:μ^=X σ2^=n1i=1∑nXi2−X2=n1i=1∑n(Xi−X)2
最大(极大)似然估计法
设X1,X2,...,Xn为来自总体X的简单随机样本,x1,x2,...,xn为样本观测值,称L(θ)=i=1∏np(xi,θ)为参数θ的似然函数,p(xi,θ)为X的P{X=xi}(X离散)或f(x,θ)在xi处的取值f(xi,θ)(X连续)L(θ)实际上就是样本X1,X2,...,Xn恰好取x1,x2,...,xn的概率设L(θ)=i=1∏np(xi,θ)为参数θ的似然函数,若存在一个只与样本观测值有关的实数θ^(x1,x2,...,xn)使得L(θ^)=maxL(θ)则称θ^(x1,x2,...,xn)为参数θ的最大似然估计值,称θ^(X1,X2,...,Xn)为参数θ的最大似然估计量对数似然函数lnL(θ)与似然函数拥有相同的最(极)大值点,故可求对数似然函数的最(极)大值来得到θ的最大似然估计对于X∼N(μ,σ2),X1,X2,...,Xn为简单随机抽样,μ的极大似然估计为X σ2的为n1i=1∑n(Xi−X)2
无偏性(最基本)
若参数θ的估计量θ^=θ^(X1,X2,...,Xn)满足E(θ^)=θ称θ^为θ的一个无偏估计量,否则称为有偏估计量
有效性
设θ1^和θ2^都是参数θ的无偏估计量,如果D(θ1^)<D(θ2^)称θ1^比θ2^有效。即在期望相等的条件下,方差小者估计的效果好
一致性(相合性)
设θn^=θ^(X1,X2,...,Xn)是θ的一个估计量,对于任意的ϵ>0,有n→∞limP{∣θn^−θ∣<ϵ}=1称θn^是θ的一致估计量(相合估计量)
区间估计
设总体X的分布函数为F(x;θ),其中θ为未知参数,X1,X2,...,Xn为简单随机样本,对于给定的α∈(0,1),如果由样本确定的两个统计量T1(X1,X2,...,Xn)和T2(X1,X2,...,Xn)满足P{T1≤θ≤T2}=1−α则称随机区间[T1,T2]是参数θ的置信度(置信水平)为1−α的置信区间若T1满足P{T1≥θ}=1−α 或 P{T1≤θ}=1−α则称T1是参数θ的置信度为1−α的单侧置信上限(或单侧置信下限)
假设检验
问题大概描述:对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。双侧检验:H1:θ=θ0 x>za/2或x<z1−a/2单侧检验:H1:θ>θ0或(θ<θ0) x>za或(x<z1−a)正态总体假设检验的基本步骤:(1)根据问题提出原假设H0和备择假设H1(2)从正态分布的六个抽样分布中选取一个只含有参数θ0的分布记为Y(3)查表得到Y的分位点如:P{Y<Y1−a/2或Y>Ya/2}=a 或 P{Y<Y1−a}=a 或 P{Y>Ya/2}=a(4)将H0的条件带入,求出Y(5)如果(3)中的分位点成立就拒绝H0否则就接受H0