范数-Frobenius范数 ################## * Frobenius 范数 是矩阵范数的一种,表示矩阵中所有元素的平方和的平方根。它衡量矩阵整体的大小,类似于向量的欧几里得范数。 Frobenius 范数定义 ================== 对于矩阵 :math:`(\mathbf{X} \in \mathbb{R}^{m \times n})` ,其 Frobenius 范数定义为: .. math:: |\mathbf{X}\|_F = \sqrt{\sum_{i=1}^m \sum_{j=1}^n x_{ij}^2} 或简写为: .. math:: |\mathbf{X}\|_F = \sqrt{\text{tr}(\mathbf{X}^\top \mathbf{X})} 其中, :math:`(\text{tr}(\cdot))` 表示矩阵的迹运算。 Frobenius 范数的平方 ==================== .. math:: |\mathbf{X}\|_F^2 = \sum_{i=1}^m \sum_{j=1}^n x_{ij}^2 它是 Frobenius 范数的平方值,也可以表示为: .. math:: |\mathbf{X}\|_F^2 = \text{tr}(\mathbf{X}^\top \mathbf{X}) 梯度公式 ======== 对于矩阵 :math:`\mathbf{X}` .. math:: \nabla_{\mathbf{X}} \|\mathbf{X}\|_F^2 = 2 \mathbf{X} - **逐元素分析:** Frobenius 范数平方的表达式中每一项是 :math:`x_{ij}^2` 。对 :math:`x_{ij}` 求导时,梯度为 :math:`2x_{ij}` - **整体矩阵形式:** 逐元素求导的结果可以直接写为矩阵形式,梯度为 :math:`2 \mathbf{X}` - **推导:** 1. 使用迹的性质: .. math:: |\mathbf{X}\|_F^2 = \text{tr}(\mathbf{X}^\top \mathbf{X}) 2. 对于迹函数的导数规则: .. math:: \nabla_{\mathbf{X}} \text{tr}(\mathbf{X}^\top \mathbf{X}) = 2 \mathbf{X} 因此: .. math:: \nabla_{\mathbf{X}} \|\mathbf{X}\|_F^2 = 2 \mathbf{X} 物理意义 ======== * Frobenius 范数可以看作是矩阵的“长度”或能量的量度,表示矩阵中所有元素平方和的平方根。 * 它的平方值 :math:`\|\mathbf{X}\|_F^2` 是矩阵所有元素平方的总和。