基于缩放的深度神经网络权重归一化

上传者：plmm97493 2021-03-03 18:45:32上传 PDF文件 3.25MB 热度 15次

将具有非线性函数逼近器的强化学习应用于高维连续控制问题的一个挑战是,由许多现有算法产生的更新策略可能无法提高策略性能,甚至导致策略性能严重下降。为了应对这一挑战,本文提出了政策改进的新下限,其中对国家空间上的平均政策分歧进行了惩罚。就我们所知,这是当前政策下限的最佳结果。直接优化策略改进的下限非常困难,因为它需要大量的计算开销。根据信任区域策略优化(TRPO)的理想,本文还提出了一种单调策略优化算法,该算法基于本文介绍的策略改进的新下限,可以生成一系列单调改进策略,适用于大规模的连续控制问题。本文还对提出的算法与现有的一些算法进行了比较,并将其与具有挑战性的机器人运动任务进行比较。

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

基于缩放的深度神经网络权重归一化

将具有非线性函数逼近器的强化学习应用于高维连续控制问题的一个挑战是,由许多现有算法产生的更新策略可能...

大小：3.25MB | 2021-03-03 18:45:32
加速深度神经网络训练的简单方法：权重归一化

权重归一化是一种简单的重新参数化方法，可用于加速深度神经网络的训练。它不会改变原有的权重分布，而是通...

大小：308.29KB | 2023-06-11 23:18:54
重归一化功能重归一化组

我们构造了有效平均作用及其流量方程的新版本。即使对于有限的重归一化组尺度，该构造尤其需要波动场和背...

大小：390KB | 2020-07-17 21:04:15
神经网络归一化matlab代码

神经网络归一化matlab代码，适合BP、SVM等各种神经网络的归一化操作，简单易懂

大小：0B | 2018-12-10 08:22:16
神经网络归一化函数mapminmax

神经网络归一化函数mapminmax最小最小归一化法，将数据归一化到[-11]之间，也能进行反归一化...

大小：0B | 2019-07-09 16:07:53
关于神经网络归一化的讨论

大小：0B | 2019-01-01 21:42:45
关于神经网络matlab归一化的整理

大小：0B | 2019-02-19 08:50:56
解析重归一化组

量子力学或量子场论中的有限温度欧几里得两点函数的特征是与松原频率νk=2πk/β相关的离散傅立叶系数...

大小：1.52MB | 2020-07-16 06:41:48
运动相关的重归一化

我们建议对运动学相关的重归一化过程中被扰动处理的不可重归一化的交互作用提出新的观点。它基于通常的B...

大小：277KB | 2020-07-26 03:53:03
潜在的重归一化组程序

电位为-g / r2的Schrödinger方程具有极限循环，该文献在文献中使用r = 0时的奇异性...

大小：324KB | 2020-07-22 01:29:31
威尔逊式视角的全息重归一化群体流动和重归一化

从威尔逊主义的观点来看，可重归一化的理论被理解为在理论空间中的子流形，该子流形是在重归一化群演化下从...

大小：1.23MB | 2020-07-16 07:10:10
x空间中改进的Epstein Glaser重归一化与差分重归一化

在这里，将使用几乎唯一的实变量方法来重新检查x空间中无质量的费曼振幅的重新归一化。我们通过分布的递...

大小：595KB | 2020-07-23 01:19:40
伽利略非重归一化的方面

我们讨论了适用于伽利略场理论的非重归一化定理及其推广。伽利略理论在许多方面与其他派生耦合的有效场论...

大小：681KB | 2020-07-17 22:42:45
黑洞时空的动态重归一化

我们构造了一个黑洞时空，其中包括以自洽的方式运行引力耦合。从经典的Schwarzschild黑洞开...

大小：392KB | 2020-07-17 23:28:30
BP神经网络输入层数据归一化研究

研究了BP网络输入数据的归一化方法,提出了一种联合归一化的新方法,从而加快了网络的学习训练速度,提高...

大小：0B | 2019-07-23 18:52:45
密集介质中的全息重归一化

本文研究了带或不带Dilaton场的带电黑色米糠的全息重正化，其双场理论描述了有限温度下的稠密介质。...

大小：1.32MB | 2020-07-17 23:28:03