[统计学]统计学
关于统计学的笔记
1. 渐近分布
抽样分布、参数估计以及假设检验构成推荐统计学核心,通过精确的抽样分布能够进行有效推导出统计量,这样可以以有限样本容量进行统计推断。在实际的抽样分布理论中,确认的精确抽样分布是有限的。因此需要借助极限的方法来作为抽样分布,其思路是当样本量无限增大时,可以进行有效的统计推断。以这种极限抽样分布的方式就是渐近分布,它也是其他推断统计的基础——例如中心极限定理。
除了精确抽样分布和上面的渐近分布,此外通过计算机进行随机模拟获得近似分布的方式是一种随机模拟方法(相关内容属于统计模拟计算)。
2. 二项分布的抽样分布
对于计量值的变量的抽样分布研究问题的一个例子,假定总体中对某产品的喜好比例为 $\pi$ 中进行抽样 $n$ 个体调查,对产品喜好的概率。这种问题就是从二项分布进行抽样估计,根据二项分布原理和渐近分布原理可以得到喜好产品的数量为 $\hat{m}\sim \mathcal{N}(n \pi, n \pi(1-\pi))$。对于结果需要表示为喜好比例的情况,需要根据以下计算公式推导:
$$
\begin{align}
\exists& \hspace{.5cm} \text{变量 }x\text{ 满足 } E(x)=\mu, D(x)=\sigma^2 \
&\forall \text{ 常数 } \lambda \text{ 使 } \lambda\cdot x \text{ 的期望与方差变为 } E(\lambda \cdot x)=\lambda \cdot \mu, D(\lambda \cdot x)=(\lambda\cdot \sigma)^2 \
\end{align}
$$
所以存在一个比例 $\hat{p}=\frac{\hat{m}}{n}$,所以 $\hat{p}\sim \mathcal{N}(\pi, \frac{\pi(1-\pi)}{n})$