8.6. GELU

  • GELU (Gaussian Error Linear Unit)

  • 近似于 ReLU,在神经网络中表现良好,但具有更加平滑的导数,在某些情况下能够提供更好的性能。

  • 公式:

GELU(x)=xΦ(x)Φ(x)