softlearning:Softlearning是用于在连续域中训练最大熵策略的强化学习框架。包括Soft Actor Critic算法的正式实现源码

Name: softlearning:Softlearning是用于在连续域中训练最大熵策略的强化学习框架。 包括Soft Actor Critic算法的正式实现 源码
Rating: 4.5 (31 reviews)
Author: appalling2601

上传者：appalling2601 2021-02-24 03:36:24上传 ZIP文件 157.41KB 热度 31次

软学习软学习是一种深度强化学习工具箱,用于在连续域中训练最大熵策略。该实现相当薄,并且主要针对我们自己的开发目的进行了优化。对于大多数模型类(例如策略和值函数),它都使用tf.keras模块。我们使用Ray进行实验编排。 Ray Tune和Autoscaler实现了几项简洁的功能,使我们能够无缝运行与用于本地原型制作的实验脚本相同的实验脚本,以在任何选定的云服务(例如GCP或AWS)上启动大规模实验,并智能地并行化和分发培训以提高效率。资源分配。此实现使用Tensorflow。对于软参与者批评的PyTorch实现,请看一下。入门先决条件该环境可以使用conda在本地运行,

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

softlearning Softlearning是用于在连续域中训练最大熵策略的强化学习框架包括Soft Actor Critic算法的正式实现源码

软学习软学习是一种深度强化学习工具箱,用于在连续域中训练最大熵策略。该实现相当薄,并且主要针对我...

大小：157KB | 2021-02-24 03:36:24
深度强化学习 - Actor-Critic

大小：0B | 2019-03-28 23:42:37
Soft Actor Critic SAC算法tensorflow实现

Soft Actor-Critic(SAC)算法tensorflow实现,SAC是深度强化学习中对于...

大小：19KB | 2020-08-16 01:27:00
强化学习深度学习Actor critic.ppt

由于实验室要求每周PPT分享汇报,在这一过程中,需要花费时间去整理强化学习,深度学习,Actor-...

大小：2.6MB | 2020-08-21 05:50:32
Soft Actor Critic.pdf

关于Soft Actor-Critic 的原始论文,适合初学者对深度强化学习Soft Actor-C...

大小：4.18MB | 2021-04-19 17:42:34
最大熵模型的介绍学习最大熵的基础

大小：0B | 2019-02-11 15:16:32
使用Actor Critic强化学习在具有混合能源的HetNets中进行功率分配

使用Actor-Critic强化学习在具有混合能源的HetNets中进行功率分配

大小：400KB | 2021-04-07 10:56:15
最大熵源码

大小：0B | 2019-03-14 01:38:14
OpenCV实现最大熵

OpenCV achieves maximum entropy

大小：0B | 2019-06-22 03:37:01
深度强化学习的交叉熵优化与策略优化算法

压缩文件中有两个.py文件，分别为深度强化学习的交叉熵优化方法和策略优化方法的完整代码，readme...

大小：0B | 2019-05-05 01:26:48
最大熵模型JAVA实现

大小：0B | 2019-01-03 02:00:50
最大熵模型

最大熵matlab编程　好，我费了好大的劲才编写成功的，希望对大家有利。

大小：0B | 2019-09-25 15:44:32
最大熵分割

Maximum entropy segmentation

大小：0B | 2019-06-22 03:37:11
多巴胺多巴胺是用于强化学习算法的快速原型制作的研究框架源码

多巴胺多巴胺是用于强化学习算法的快速原型制作的研究框架。它旨在满足对小型,易处理的代码库的需求,...

大小：5.9MB | 2021-02-06 12:32:30
机器学习_最大熵模型

最大熵模型（MaximumEntropyModel，以下简称MaxEnt），MaxEnt是概率模型学...

大小：0B | 2019-05-05 23:52:25
最大熵模型与EM算法

最大熵模型与EM算法

大小：0B | 2019-06-01 02:11:53

softlearning:Softlearning是用于在连续域中训练最大熵策略的强化学习框架。 包括Soft Actor Critic算法的正式实现 源码

softlearning:Softlearning是用于在连续域中训练最大熵策略的强化学习框架。包括Soft Actor Critic算法的正式实现源码