概统公式

约 5831 字大约 19 分钟

DLUT 概率与统计

2026-05-13

该总结仅基于大连理工大学指定课本，如有遗落本人概不负责拒绝付费转发

概统概率公式总结

概率论的基本概念

补事件

$A-B=A-AB=A\overline{B}$

德摩根律

$\overline{\bigcup^n_{i=1}A_i}=\bigcap^n_{i=1}\overline{A_i}$ $\overline{\bigcap^n_{i=1}A_i}=\bigcup^n_{i=1}\overline{A_i}$

概率可加性

$P(\bigcup^\infty_{i=1} A_i)=\sum^\infty_{i=1}P(A_i) 其中A_1 A_2 ...是一列两两互不相容的事件$ $P(\bigcup^n_{i=1} A_i)=\sum^n_{i=1}P(A_i) 其中A_1 A_2 ...A_n是一列两两互不相容的事件$

一些常识

$P(\emptyset)=0$ $如果A\subset B,则P(A)\leq P(B)~~~~~反之不一定成立$ $P(A)+P(\overline{A})=1$

加减法公式

$P(A-B)=P(A\overline{B})=P(A)-P(AB)$ $P(A\cup B)=P(A)+P(B)-P(AB)$ $P(A\cup B\cup C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)$

古典概型

$P(A)=\dfrac{k}{n}~~~~其中k是事件A的样本点数，n是样本总点数$

几何概型

$P(A)=\dfrac{S_A}{S_\Omega}~~~~~其中S_A是事件A对应的面积，S_\Omega是总面积$

条件概率

$P(A|B)=\dfrac{P(AB)}{P(B)}~~~~P(B)>0~~~B发生情况下A发生的条件概率$

乘法公式

$P(AB)=P(A)P(B|A)=P(B)P(A|B)$ $P(A_1A_2A_3...A_n)=P(A_1)P(A_2|A_1)P(A_3|A_1A_2)...P(A_n|A_1A_2...A_{n-1})$

全概率公式

$P(B)=\sum_{i=1}^\infty P(A_i)P(B|A_i)~~~~A_i是一个划分$

贝叶斯公式

$P(A_k|B)=\dfrac{P(A_k)P(B|A_k)}{\sum_{i=1}^nP(A_i)P(B|A_i)}$

独立的判断与性质

$P(AB)=P(A)P(B)~与~A、B独立互为充要条件$ $(A,B)、(A,\overline{B})、(\overline{A},B)、(\overline{A},\overline{B})四个之中只要有一个独立，其余三个均独立$ $若A与A独立则P(A)=0或1$ $P(A)>0,P(B)>0~~~AB=\emptyset 则A与B独立,二者互为充要条件$

从A_!,A_2,...,A_n中任取k(2\leq k \leq n)个事件均满足\\ P(A_{i_1}A_{i_2}...A_{i_n})=P(A_{i_1})P(A_{i_2})...P(A_{i_n})

伯努利实验

$如果实验E只有两个结果：A和\overline{A}，并且P(A)=p,P(\overline{A})=q,把实验E独立的重复n次构成一个实验，成为n重伯努利实验$

随机变量及其类型

分布函数及其性质

F(x)=P(X\leq x)\\ F(\infty)=1,F(-\infty)=0\\ F(x)为x的单调不减函数\\ P(a\leq X\leq b)=F(b)-F(a-0)\\ P(a<X\leq b)=F(b)-F(a)\\ P(a<X<b)=F(b-0)-F(a)\\ P(a\leq X<b)=F(b-0)-F(a-0)

二项分布

写作X\sim B(n,p) n为实验次数，p为成功概率\\ P(X=k)=C_n^kp^kq^{n-k},k=0,1,...,n\\ E(X)=np ~~~ D(X)=npq=np(1-p)

泊松分布

写作X\sim P(\lambda) ~~~\lambda 为参数且大于零\\ P(X=k)=\dfrac{\lambda ^k}{k!}e^{-\lambda}，~~k=0,1,...,\\ E(X)=\lambda ~~~ D(X)=\lambda ~~~ E(X^2)=\lambda^2 + \lambda\\ 设X,Y相互独立，且分别服从参数为\lambda_1,\lambda_2的泊松分布Z=X+Y有Z\sim P(\lambda_1+\lambda_2)

几何分布

写作X\sim G(p),P>0\\ P(X=k)=pq^{k-1}=p(1-p)^{k-1},~~~k=1,2,...,\\ E(X)=\dfrac{1}{p} ~~~ D(X)=\dfrac{q}{p^2}=\dfrac{1-p}{p^2} ~~~ E(X^2)=\dfrac{q+1}{P^2}\\ P(X>n+m|X>m)=P(X>n)~~~~几何分布的无记忆性

超几何分布

写作X\sim H(n,M,N)~~~N>M,N>n\\ P(X=k)=\dfrac{C_M^kC_{N-M}^{n-k}}{C_N^n},~~~~k=0,1,...,min(M,n)

密度函数及性质

$F(x)=\int^x_{-\infty}f(t)dt,x\in R~~~~~f(x)即为密度函数$ $0\leq f(x)~~~~~~~~\int^\infty _{-\infty}f(x)=1$ $P(X=c)=0~~~c为常数$ $P(a<x<b)=P(a<x\leq b)=P(a\leq x<b)=P(a\leq x \leq b)=\int^b_af(x)dx$

均匀分布

写作X\sim U(a,b)\\ f(x)=\dfrac{1}{b-a}~~x\in(a,b)~~~F(x)=\dfrac{x-a}{b-a}~~x\in(a,b)\\ E(x)=\dfrac{a+b}{2}~~~E(x^2)=\dfrac{a^2+b^2+ab}{3}~~~D(x)=\dfrac{(b-a)^2}{12}

指数分布

写作X\sim E(\lambda)\\ f(x)=\lambda e^{-\lambda x}~~x>0~~~~F(x)=1-e^{-\lambda x}~~x>0\\ E(x)=\dfrac{1}{\lambda}~~~E(x^2)=\dfrac{2}{\lambda^2}~~~D(x)=\dfrac{1}{\lambda^2}\\ P(X>t+s|X>s)=P(X>t)~~~指数分布的无记忆性

正态分布

写作X\sim N(\mu,\sigma^2)\\ f(x)=\dfrac{1}{\sqrt{2\pi}\sigma}e^{-\dfrac{(x-\mu)^2}{2\sigma ^2}}~~x\in R\\ 将\mu=0,\sigma^2=1的正态分布称为标准正态分布，其分布函数写作\Phi(x)~~密度函数写作\phi(x)\\ \phi(x)=\dfrac{1}{\sqrt{2\pi}}e^{-\dfrac{x^2}{2}}~~~\Phi(x)=\int^x_{-\infty}\phi(t)dt\\ 若X\sim N(\mu,\sigma^2),令Z=\dfrac{X-\mu}{\sigma}，则Z\sim N(0,1)\\ E(x)=\mu~~~D(x)=\sigma^2\\ 设X_1,X_2,...,X_n相互独立,且X_i\sim N(\mu _i,\sigma^2_i),i=1,2,...,n那么对于任意常数a_i,i=1,2,...,n以及常数c,有\\ \sum^n_{i=1}a_iX_i+c~~\sim N(\sum^n_{i=1}a_i\mu _i+c,\sum^n_{i=1}a_i^2\sigma^2_i)~~~~正态分布的可加性

离散型随机变量函数的分布列

若X\sim \left[\begin{matrix} x_1~x_2~x_3 ...\\ p_1~p_2~p_3 ... \end{matrix}\right]~~~Y=g(X),则\\ Y\sim \left[\begin{matrix} g(x_1)~g(x_2)~g(x_3) ...\\ p_1~~~~~p_2~~~~~p_3 ... \end{matrix}\right]

一个定理

设连续性随机变量X的密度函数为f_X(x),y=g(x)是一个严格单调函数，且具有一阶连续导函数，x=h(y)是y=g(x)的反函数，则Y=g(X)的密度函数为\\ f_Y(y)=f_X(h(y))|h'(y)|

二维随机变量的联合分布函数及其性质

设二维随机变量(X,Y)，对任意实数x,y,二元函数\\ F(x,y)=P(X\leq x,Y\leq y)~~~称为(X,Y)的联合分布函数\\ P(x_1<X\leq x_2,y_1<Y\leq y_2)=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1)\\ F(x,y)对x或y都是不减函数，即对任意y,若x_1\leq x_2,则F(x_1,y)\leq F(x_2,y)，对于任意的x同理\\ F(-\infty,y)=0~~~F(x,-\infty)=0~~~F(-\infty,-\infty)=0~~~F(\infty,\infty)=1\\ F(x+0,y)=F(x,y)=F(x,y+0)

边际分布函数

$F_X(x)=F(x,\infty)~~~~F_Y(y)=F(\infty,y)$

二维离散型随机变量的独立性

设(X,Y)为二维离散型随机变量，X与Y的可能取值分别为x_1,x_2,...与y_1,y_2,...如果对任意的i,j=1,2,...都有\\ P(X=x_i,Y=y_j)=P(X=x_i)P(Y=y_j)~~~则称X与Y是相互独立的

二维离散型随机变量的条件分布列

设(X,Y)为二维离散型随机变量，X与Y的可能取值分别为x_1,x_2,...与y_1,y_2,...如果对任意的i,j=1,2,...，称\\ p_{i|j}=P(X=x_i|Y=y_j)=\dfrac{P(X=x_i,Y=y_j)}{P(Y=y_j)}为已知\lbrace Y=y_j \rbrace的条件下X的分布列

二维连续型随机变量及性质

设F(x,y)为二维随机变量(X,Y)的联合分布函数,若存在非负函数f(x,y)使得对于任意的x,y\in R,有\\ F(x,y)=\int^x_{-\infty}\int^y_{-\infty}f(u,v)dudv\\ 则f(x,y)为(X,Y)的联合概率密度函数\\ f(x,y)\ge0~~~~\int^\infty _{-\infty}\int^\infty _{-\infty}f(x,y)dxdy=1\\ \dfrac{\partial^2F(x,y)}{\partial x\partial y}=f(x,y)\\ f_X(x)=\int^\infty _{-\infty}f(x,y)dy,x\in R~~~~~~f_Y(y)=\int^\infty _{-\infty}f(x,y)dx,y\in R\\ f_X(x)为X的边际密度函数~~~~~~~f_Y(y)为Y的边际密度函数

二维均匀分布

D为平面有界闭区域,面积为S_D~~~f(x,y)=\dfrac{1}{S_D}~~(x,y)\in D\\ 若G为D的子区域~~~P((X,Y)\in G)=\iint_G f(x,y)d\sigma=\dfrac{1}{S_D}\iint_G d\sigma=\dfrac{S_G}{S_D}

二维正态分布

写作(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho),\sigma_1>0,\sigma_2>0,|\rho|<1\\ f(x,y)=\dfrac{1}{2\pi \sigma_1\sigma_2 \sqrt{1-\rho^2}}e^{\dfrac{-1}{2(1-\rho^2)}[\dfrac{(x-\mu_1)^2}{\sigma_1^2}-\dfrac{2\rho(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\dfrac{(y-\mu_2)^2}{\sigma_2^2}]} \\ 二维正态分布的两个边缘分布都是一维正态分布,且参数分别为(\mu_1,\sigma_1)和(\mu_2,\sigma_2) \\具有相同的参数\mu_1,\mu_2,\sigma_1,\sigma_2，但\rho不同的二维正态分布具有相同的边缘分布函数\\ X与Y相互独立的充要条件是\rho=0\\ 设Z=aX+bY、W=cX+dY~~~a~b~c~d均为常数,则(Z,W)也遵从二维正态分布，且Z和W均为一维正态分布

二维连续型随机变量的独立性

若对于所有的x,y有\\ f(x,y)=f_X(x)f_Y(y)~~或~~F(x,y)=F_X(x)F_Y(y)~~~~~则称X和Y相互独立\\ 若(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho),则X与Y相互独立的充要条件是\rho=0

二维连续性随机变量的条件密度

给定Y=y的条件下X的条件分布函数与条件密度函数\\ F_{X|Y}(x|y)=\int^x_{-\infty}\dfrac{f(u,y)}{f_Y(y)}du~~~~f_{X|Y}(x|y)=\dfrac{f(x,y)}{f_Y(y)}\\ 给定X=x的条件下Y的条件分布函数与条件密度函数\\ F_{Y|X}(y|x)=\int^y_{-\infty}\dfrac{f(x,u)}{f_X(x)}du~~~~f_{Y|X}(y|x)=\dfrac{f(x,y)}{f_X(x)}\\ f(x,y)=f_X(x)f_{Y|X}(y|x)=f_Y(y)f_{X|Y}(x|y)

极大极小分布

设随机变量X_1,X_2,...,X_n相互独立,且X_i的分布函数为F_{X_i}(x),i=1,2,...\\ 令Y=max\lbrace X_1,X_2,...,X_n\rbrace~~~Z=min\lbrace X_1,X_2,...,X_n\rbrace\\ Y的分布函数F_{max}=\prod^n_{i=1}F_{X_i}(x)\\ Z的分布函数F_{min}=1-\prod^n_{i=1}(1-F_{X_i}(x))\\ 特别的,如果X_1,X_2,...,X_n的分布函数相同，有\\ F_{max}=F(x)^n~~~~F_{min}=1-(1-F(x))^n\\ max\lbrace X,Y\rbrace=\dfrac{1}{2}(X+Y+|X-Y|)\\ min\lbrace X,Y\rbrace=\dfrac{1}{2}(X+Y-|X-Y|)

随机变量的数字特征

数学期望

EX=\sum^{\infty}_{k=1}x_kp_k~~~~(离散型随机变量)\\ E(X)=\int^\infty _{-\infty}xf(x)dx~~~~(连续型随机变量)\\ 设Y=g(X),则E(Y)=\sum^\infty _{k=1}g(x_k)p_k~~(X是离散)~~~~~E(Y)=\int^\infty _{-\infty}g(x)f(x)dx~~(X是连续)\\ 设Z=g(X,Y),f(x,y)为(X,Y)的密度函数则,E(Z)=\sum^\infty _{i=1}\sum^\infty _{j=1}g(x_i,y_j)p_{ij}~~(Z是离散)~~~~~E(Z)=\int^\infty _{-\infty}\int^\infty _{-\infty}g(x,y)f(x,y)dxdy~~(Z是连续)\\ 设(X,Y)为二维离散随机变量有~~E(X)=\sum^\infty _{i=1}\sum^\infty _{j=1}x_ip_{ij}~~~~~E(Y)=\sum^\infty _{j=1}\sum^\infty _{i=1}y_jp_{ij}\\ 设(X,Y)为二维连续随机变量,联合概率密度函数为f(x,y)有~~E(X)=\int^\infty _{-\infty}\int^\infty _{-\infty}xf(x,y)dxdy~~~~~E(Y)=\int^\infty _{-\infty}\int^\infty _{-\infty}yf(x,y)dxdy\\ E(c)=c~~~E(cX)=cE(X)~~~c为常数\\ E(X_1+X_2)=E(X_1)+E(X_2)\\ 若X与Y相互独立，则E(XY)=E(X)E(Y)~~~~g(X)~h(Y)为X和Y的函数,E[g(x)h(y)]=E[g(x)]E[h(y)]\\ E(XY)=\iint[f(x, y)*x*y]dxdy

方差

D(X)=E\lbrace [E-E(X)]^2\rbrace=E(X^2)-[E(x)]^2=\sigma _X^2\\ D(c)=0~~~c为常数\\ D(aX+b)=a^2D(X)~~~a与b均为常数\\ 若X与Y相互独立，有D(X+Y)=D(X)+D(Y)

协方差

Cov(X,Y)=E\lbrace [X-E(X)][Y-E(Y)]\rbrace=E(XY)-E(X)E(Y)\\ Cov(X,Y)=Cov(Y,X)\\ Cov(X,X)=D(X)\\ Cov(aX,bY)=ab\cdot Cov(X,Y)\\ 若X与Y相互独立，有Cov(X,Y)=0~~~~~反之不成立\\ Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)\\ D(aX+bY)=a^2D(X)+b^2D(Y)+2ab\cdot Cov(X,Y)

相关系数

\rho_{XY}=\dfrac{Cov(X,Y)}{\sqrt{D(X)D(Y)}}\\ |\rho_{XY}\leq 1|\\ 当\rho_{XY}=1时,存在正整数a与实数b使Y=aX+b(X与Y成正相关)~~~~~-1时称负相关\\ 当\rho_{XY}=0时，称X与Y不相关(只指没有线性关系,不代表独立)\\ 若(X,Y)遵守二维正态分布，X与Y相互独立的充要条件是\rho_{XY}=0

随机变量的标准化

X^*=\dfrac{X-EX}{\sqrt{DX}}\\ EX^*=0~~~~DX^*=1\\ \rho_{X,Y}=\rho_{X^*,Y^*}=EX^*Y^*

矩

$设X为一个随机变量，如果E|X|^k<\infty，k=1,2,...,则称EX^k为X的k阶原点矩，称E(X-EX)^k为X的k阶中心距$

协方差矩阵

设X_1,X_2,...,X_n为n个随机变量，令\sigma_{ij}=Cov(X_i,X_j),i,j=1,2,...,n\\ 称矩阵\sum=(\sigma)_{n\times n}为X_1,X_2,...,X_n的协方差矩阵\\ 协方差矩阵是对称矩阵，是半正定矩阵

大数定律

切比雪夫不等式

设随机变量X,E(X)=\mu~~D(X)=\sigma^2,对于任意正数\varepsilon,有\\ P\lbrace |X-\mu|\ge\varepsilon \rbrace \le \dfrac{\sigma^2}{\varepsilon^2}\\ P\lbrace |X-\mu|<\varepsilon \rbrace \ge 1-\dfrac{\sigma^2}{\varepsilon^2}

大数定律与中心极限定理

设X_1,X_2,...,X_n,...是一个随机变量序列,a是一个常数,若对于任意整数\varepsilon,有\\ \lim_{n\rightarrow\infty}P\lbrace |X_n-a|\ge\varepsilon\rbrace=0\\ 或\\ \lim_{n\rightarrow\infty}P\lbrace |X_n-a|<\varepsilon\rbrace=1\\ 则称序列X_1,X_2,...,X_n,...依概率收敛于a，记为X_n\rightarrow^Pa

切比雪夫大数定律

设X_1,X_2,...,X_n,...是一个相互独立的随机变量序列,每个随机变量都存在有限的方差,且一致有界,即存在常数C,使D(X_i)\le C,则对于任意正数\varepsilon,有\\ \lim_{n\rightarrow\infty}P\lbrace |\dfrac{1}{n}\sum^n_{i=1}X_i-\dfrac{1}{n}\sum^n_{i=1}E(X_i)|\ge\varepsilon\rbrace=0

伯努利大数定律

设n_A是n重伯努利实验中事件A的出现次数,p是事件A在每次实验中出现的概率,对任意正数\varepsilon,有\\ \lim_{n\rightarrow\infty}P\lbrace |\dfrac{n_A}{n}-p\ge\varepsilon\rbrace=0~~~或~~~\lim_{n\rightarrow\infty}P\lbrace |\dfrac{n_A}{n}-p<\varepsilon\rbrace=1

辛钦大数定律

设X_1,X_2,...,X_n,...是一系列独立同分布的随机变量,且具有数学期望E(X_i)=\mu~~~i=1,2,..,n,...,对于任意正数\varepsilon有\\ \lim_{n\rightarrow\infty}P\lbrace |\dfrac{1}{n}\sum^n_{i=1}X_i-\mu|>\varepsilon\rbrace=0~~~~(即\dfrac{1}{n}\sum^n_{i=1}X_i依概率收敛于\mu)

独立同分布的中心极限定理

设X_1,X_2,...,X_n,...是相互独立同分布的随机变量序列,且E(X_i)=\mu~~D(X_i)=\sigma^2,i=1,2,...,对于\forall x\in R,有\\ \lim_{n\rightarrow\infty}P\lbrace \dfrac{\sum^n_{i=1}X_i-n\mu}{\sqrt{n}\sigma}\le x\rbrace=\Phi(x)\\ 即\\ \lim_{n\rightarrow\infty}P((\sum^n_{i=1}X_i)^*\le x)=\Phi(x)

棣莫弗-拉普拉斯中心极限定理

设随机变量X是n重伯努利实验中事件A的出现次数,p是事件A在每次实验中出现的概率,对任意实数x,有\\ \lim_{n\rightarrow\infty}P\lbrace \dfrac{X-np}{\sqrt{np(1-p)}}\le x\rbrace=\dfrac{1}{\sqrt{2\pi}}\int^x_{-\infty}e^{-\dfrac{t^2}{2}}dt=\Phi(x)

概统统计公式总结

数理统计的基本概念

一些重要的统计量

设X_1,X_2,...,X_n是从总体X中抽取的样本\\ \overline{X}=\dfrac{1}{n}\sum^n_{i=1}x_i~~~~~样本均值\\ S^2=\dfrac{1}{n-1}\sum^n_{i=1}(x_i-\overline{x})^2=\dfrac{1}{n-1}(\sum^n_{i=1}x_i^2-n\overline{X}^2)~~~~~样本方差\\ S=\sqrt{\dfrac{1}{n-1}\sum^n_{i=1}(x_i-\overline{x})^2}~~~~~样本标准差\\ A_k=\dfrac{1}{n}\sum^n_{i=1}X^k_i~~~k=1,2,...~~~~~样本k阶原点矩\\ X_{(n)}=max\lbrace X_1,X_2,...,X_n\rbrace~~~~~~极大次序统计量\\ X_{(1)}=min\lbrace X_1,X_2,...,X_n\rbrace~~~~~~极小次序统计量

$\chi^2$ 分布

设X_1,X_2,...,X_n相互独立，且均服从N(0,1)，称\\ \chi^2=X_1^2+X_2^2+...+X_n^2~~~~为服从自由度为n的\chi^2分布，记作\chi^2(n)\\ 若X\sim \chi^2(n),Y\sim \chi^2(m),且X与Y相互独立,则X+Y\sim \chi^2(n+m)~~~\chi^2分布的可加性\\ 若X\sim \chi^2(n),有E[\chi^2(n)]=n~~~D[\chi^2(n)]=2n

t分布

设X\sim N(0,1),Y\sim \chi^2(n),且X与Y相互独立,称\\ t=\dfrac{X}{\sqrt{Y/n}}为服从自由度为n的t分布,记作t(n)\\ 当n充分大时,t分布可以近似看做标准正态分布

F分布

设X\sim \chi^2(n),Y\sim \chi^2(m),且X与Y相互独立,称\\ F=\dfrac{X/n}{Y/m}为服从自由度为n,m的F分布,记作F(n,m)\\ t(n)^2=F(1,n)~~~~~~F(n,m)=\dfrac{1}{F(m,n)}

单正态总体的抽样分布定理

设总体X\sim N(\mu,\sigma^2),X_1,X_2,...,X_n是总体X的简单随机样本,样本均值为\overline{X},样本方差为S^2,有\\ E(\overline{X})=\mu~~~D(\overline{X})=\dfrac{\sigma^2}{n}\\ E(S^2)=\sigma^2~~~D(S^2)=\dfrac{2\sigma^4}{n-1}\\ \dfrac{\overline{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1)\\ \dfrac{n-1}{\sigma^2}S^2\sim \chi^2(n-1),且\overline{X}与S^2相互独立~~~~\dfrac{1}{\sigma^2}\sum^n_{i=1}(x_i-\overline{X})^2\sim \chi^2(n-1)\\ \dfrac{\overline{X}-\mu}{S/\sqrt{n}}\sim t(n-1)

双正态总体的抽样分布定理

设总体X\sim N(\mu_1,\sigma_1^2)与Y\sim N(\mu_2,\sigma_2^2)相互独立,X_1,X_2,...,X_n是总体X的简单随机样本,Y_1,Y_2,...,Y_m是总体Y的简单随机样本\\ 以\overline1{X},\overline{Y},S_1^2,S_2^2分别表示两组样本的均值与方差\\ \dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{\sqrt{\dfrac{\sigma_1^2}{n}+\dfrac{\sigma_2^2}{m}}}\sim N(0,1)\\ \dfrac{S_1^2}{S_2^2}\dfrac{\sigma_2^2}{\sigma_1^2}\sim F(n-1,m-1)\\ 若\sigma_1^2=\sigma_2^2则\\ \dfrac{(\overline{X}-\overline{Y})-(\mu_1-\mu_2)}{S_w\sqrt{\dfrac{1}{n}+\dfrac{1}{m}}}\sim t(n+m-2)\\ 其中S_w=\sqrt{\dfrac{(n-1)S_1^2+(m-1)S_2^2}{n+m-2}}

正态分布的上a分位点

设随机变量Z\sim N(0,1),若对a\in(0,1),实数z_a满足\\ P\lbrace Z>z_a\rbrace=a\\ 则称z_a为标准正态分布的上a分位点\\ z_{1-a}=-z_a~~~~\Phi(z_a)=1-a

$\chi^2$ 分布上的a分位点

设随机变量\chi^2\sim \chi^2(n)若对a\in(0,1),实数\chi^2_a(n)满足\\ P\lbrace \chi^2>\chi^2_a(n)\rbrace=a\\ 则称\chi^2_a(n)为\chi^2(n)的上a分位点\\ P\lbrace \chi^2(n)\leq \chi^2_{1-a}(n)\rbrace=a

t分布的上a分位点

设随机变量t\sim t(n),若对a\in(0,1),实数t_a(n)满足\\ P\lbrace t>t_a(n)\rbrace=a\\ 则称t_a(n)为t(n)分布的上a分位点\\ t_{1-a}(n)=-t_a(n)

F分布的上a分位点

设随机变量F\sim F(n,m),若对a\in(0,1),实数F_a(n,m)满足\\ P\lbrace F>F_a(n,m)\rbrace=a\\ 则称F_a(n,m)为F(n,m)分布的上a分位点\\ F_{1-a}(n,m)=\dfrac{1}{F_a(m,n)}~~~~~P\lbrace F(m,n)>\dfrac{1}{F_a(n,m)}\rbrace=1-a

连续分布的上a分位点

设随机变量Y为一个连续型随机变量,若对a\in(0,1),实数Y_a满足\\ P\lbrace Y>Y_a\rbrace=a\\ 则称Y_a为Y的上a分位点\\ P\lbrace Y>Y_a\rbrace=a~~~~~~P\lbrace Y<Y_{1-a}\rbrace=a\\ P\lbrace Y<Y_{1-a/2}或Y>Y_{a/2}\rbrace=a~~~~~~P\lbrace Y<Y_a\rbrace=1-a\\ P\lbrace Y>Y_{1-a}\rbrace=1-a~~~~~~P\lbrace Y_{1-a/2}<Y<Y_{a/2}\rbrace=1-a\\

点估计

矩估计法

即用样本矩替换同阶总体矩,如一阶样本矩A_1=\dfrac{1}{n}\sum^n_{i=1}x_i=EX=\overline{X}=h(\theta)\\ 对于总体有多个未知数的情况:h_i(\theta_1,\theta_2,...,\theta_k)=E(X^i)=A_i=\dfrac{1}{n}\sum^n_{j=1}x_j^i~~~(i=1,2,3,...,k)\\求解相应的多元方程组就好，若遇到没有意义的方程组只需要继续求更高阶的矩就好\\ 对于任意的分布有:\hat{\mu}=\overline{X}~~~~\hat{\sigma^2}=\dfrac{1}{n}\sum^n_{i=1}X^2_i-\overline{X}^2=\dfrac{1}{n}\sum^n_{i=1}(X_i-\overline{X})^2

最大（极大）似然估计法

设X_1,X_2,...,X_n为来自总体X的简单随机样本,x_1,x_2,...,x_n为样本观测值,称\\ L(\theta)=\prod^n_{i=1}p(x_i,\theta)\\为参数\theta的似然函数,p(x_i,\theta)为X的P\lbrace X=x_i\rbrace(X离散)或f(x,\theta)在x_i处的取值f(x_i,\theta)(X连续)\\ L(\theta)实际上就是样本X_1,X_2,...,X_n恰好取x_1,x_2,...,x_n的概率\\ 设L(\theta)=\prod^n_{i=1}p(x_i,\theta)为参数\theta的似然函数,若存在一个只与样本观测值有关的实数\hat{\theta}(x_1,x_2,...,x_n)使得\\ L(\hat{\theta})=\max L(\theta)\\ 则称\hat{\theta}(x_1,x_2,...,x_n)为参数\theta的最大似然估计值,称\hat{\theta}(X_1,X_2,...,X_n)为参数\theta的最大似然估计量\\ 对数似然函数\ln L(\theta)与似然函数拥有相同的最（极）大值点，故可求对数似然函数的最（极）大值来得到\theta的最大似然估计\\ 对于X\sim N(\mu,\sigma^2),X_1,X_2,...,X_n为简单随机抽样,\mu的极大似然估计为\overline{X}~~~\sigma^2的为\dfrac{1}{n}\sum^n_{i=1}(X_i-\overline{X})^2

点估计优良性的评定标准

无偏性(最基本)

若参数\theta的估计量\hat{\theta}=\hat{\theta}(X_1,X_2,...,X_n)满足\\ E(\hat{\theta})=\theta\\ 称\hat{\theta}为\theta的一个无偏估计量,否则称为有偏估计量

有效性

设\hat{\theta_1}和\hat{\theta_2}都是参数\theta的无偏估计量,如果\\ D(\hat{\theta_1})<D(\hat{\theta_2})\\ 称\hat{\theta_1}比\hat{\theta_2}有效。即在期望相等的条件下，方差小者估计的效果好

一致性(相合性)

设\hat{\theta_n}=\hat{\theta}(X_1,X_2,...,X_n)是\theta的一个估计量,对于任意的\epsilon>0,有\\ \lim_{n\rightarrow \infty}P\lbrace |\hat{\theta_n}-\theta|<\epsilon\rbrace=1\\ 称\hat{\theta_n}是\theta的一致估计量(相合估计量)

参数的区间估计和假设检验

区间估计

设总体X的分布函数为F(x;\theta),其中\theta为未知参数,X_1,X_2,...,X_n为简单随机样本,对于给定的\alpha\in(0,1),如果由样本确定的两个统计量T_1(X_1,X_2,...,X_n)和T_2(X_1,X_2,...,X_n)满足\\ P\lbrace T_1\le\theta\le T_2\rbrace=1-\alpha\\ 则称随机区间[T_1,T_2]是参数\theta的置信度(置信水平)为1-\alpha的置信区间\\ 若T_1满足\\ P\lbrace T_1\ge\theta\rbrace=1-\alpha~~或~~P\lbrace T_1\le\theta\rbrace=1-\alpha\\ 则称T_1是参数\theta的置信度为1-\alpha的单侧置信上限(或单侧置信下限)

假设检验

问题大概描述：对总体参数提出一个假设值，然后利用样本信息判断这一假设是否成立。\\ 双侧检验:H_1:\theta\neq\theta_0~~~~x>z_{a/2}或x<z_{1-a/2}\\ 单侧检验:H_1:\theta>\theta_0或(\theta<\theta_0)~~~~~x>z_{a}或(x<z_{1-a})\\ 正态总体假设检验的基本步骤:\\ (1)根据问题提出原假设H_0和备择假设H_1\\ (2)从正态分布的六个抽样分布中选取一个只含有参数\theta_0的分布记为Y\\ (3)查表得到Y的分位点如:P\lbrace Y<Y_{1-a/2}或Y>Y_{a/2}\rbrace=a~~或~~P\lbrace Y<Y_{1-a}\rbrace=a~~或~~P\lbrace Y>Y_{a/2}\rbrace=a\\ (4)将H_0的条件带入,求出Y\\ (5)如果(3)中的分位点成立就拒绝H_0否则就接受H_0