主页

索引

模块索引

搜索页面

Perplexity(PPL)困惑度

  • 困惑度是衡量语言模型质量的一种指标,反映模型预测序列中下一个词的确定性或不确定性。简言之,它表示模型在生成下一个词时的“迷惑程度”,困惑度越低,模型的预测越好,越接近真实分布。
    • 高困惑度:模型预测模糊,对下一个词有很多不确定性。

    • 低困惑度:模型预测清晰,接近真实分布。

总结

  • 困惑度是交叉熵的指数形式,反映模型对下一个词预测的平均不确定性。

  • 公式: \(Perplexity=exp(CrossEntropyLoss)\)

  • 低困惑度表示模型性能更好,对序列的预测更加准确。

  • 优点:易解释、适合性能评估和优化反馈。

  • 不足:不能单独衡量语言流畅性或语法质量。

主页

索引

模块索引

搜索页面