方差/标准差¶

方差¶

用于衡量一组数据的离散程度或分散程度。它反映了数据点与其均值之间的偏差程度。具体而言，方差越大，数据的分布越分散；方差越小，数据越集中。
方差（Variance）是统计学和概率论中用于度量一组数值分散程度的重要指标。它衡量的是这些数值相对于其平均值的离散程度，即数据点与平均值之间的差异有多大。方差越大，表示数据点分布越广；方差越小，则表示数据点更紧密地聚集在平均值周围。

定义¶

总体方差¶

对于一个随机变量 X，其方差通常记作 Var(X) 或 σ^2 ，定义为：

\begin{array}{r} \begin{array}{l} Var (X) = E [(X - μ)^{2}] \\ 这 里 : \\ - E [\cdot] 表 示 期 望 值 （ 即 平 均 值 或 均 值 ） \\ - μ = E [X] 是 随 机 变 量 X 的 期 望 值 \\ - X - μ 是 每 个 观 测 值 与 平 均 值 之 差, 也 称 为 偏 差 \\ - (X - μ)^{2} 是 偏 差 的 平 方, 确 保 了 所 有 偏 差 都 是 正 数, 并 且 放 大 了 较 大 偏 差 的 影 响 \end{array} \end{array}

总体方差（适用于整个人群或完整数据集）

\begin{array}{r} \begin{array}{l} σ^{2} = \frac{1}{N} \sum_{i = 1} N (x_{i} - μ)^{2} \\ N : 数 据 点 总 数 \\ μ : 总 体 均 值 \end{array} \end{array}

样本方差¶

样本方差（用于估计总体的离散程度）

\begin{array}{r} \begin{array}{l} s^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2} \\ n : 样 本 数 据 点 总 数 \\ \bar{x} : 样 本 均 值 \\ 样 本 方 差 中 分 母 为 𝑛 - 1 是 为 了 校 正 偏 差 ， 这 一 调 整 被 称 为 贝 塞 尔 校 正 。 \end{array} \end{array}

意义¶

衡量离散程度：方差为零意味着所有数据点都相等，完全没有分散性。方差越大，数据分布越宽，偏离均值的程度越高。
分析数据的分布特性：在数据建模中，方差可以帮助理解数据的波动性，进而指导优化模型或做出预测。
标准差的基础：方差的平方根即为标准差（Standard Deviation, 𝜎 或 𝑠），它是与数据离散性相关的另一个常用指标。

标准差¶

标准差（Standard Deviation）是统计学中用来衡量数据分布离散程度的指标之一，它是方差的平方根。与方差相比，标准差的单位与原始数据相同，因此更直观地反映了数据的波动情况。

公式¶

总体标准差（适用于整个人群或完整数据集）：

\begin{array}{r} \begin{matrix} σ = \sqrt{\frac{1}{N} \sum_{i = 1} N (x_{i} - μ)^{2}} \\ σ ： 总 体 标 准 差 𝑁 ： 数 据 点 总 数 𝜇 ： 总 体 均 值 𝑥_{𝑖} ： 第 𝑖 个 数 据 点 \end{matrix} \end{array}

样本标准差（用于从样本估计总体标准差）：

\begin{array}{r} \begin{matrix} s = \sqrt{\frac{1}{n - 1} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2}} \\ \begin{matrix} s ： 样 本 标 准 差 \\ n : 样 本 数 据 点 总 数 \\ \bar{x} : 样 本 均 值 \\ 𝑥_{𝑖} ： 第 𝑖 个 数 据 点 \end{matrix} \end{matrix} \end{array}

On This Page
方差/标准差¶
方差¶
定义¶
总体方差¶
样本方差¶
意义¶
标准差¶
公式¶

Powered by Yiting & Majiang