概率分布-Sparsemax ################## * 一个类似于 Softmax 的函数,但它的输出会稀疏化(部分值变为零)。 * 公式: 更复杂,涉及对部分值进行裁剪。 * 用途: 用于解释性更强的分类问题。