Exponential Moving Average
指数移动平均 (EMA) 是一种平滑技术,它通过维护一个模型的两个副本来解决训练不稳定的问题:
- 在线网络 (Online Network): 正常接收梯度并快速更新的网络。
- 目标网络 (Target Network): 从不接收梯度,其权重是“在线网络”过去所有权重的一个指数加权平均。
它的工作机制是,在每次更新“在线网络”后,都通过以下公式极其缓慢地更新“目标网络”:
指数移动平均 (EMA) 是一种平滑技术,它通过维护一个模型的两个副本来解决训练不稳定的问题:
它的工作机制是,在每次更新“在线网络”后,都通过以下公式极其缓慢地更新“目标网络”: