有大脑的大脑:通过深度强化学习探索弦真空
我们建议将深度强化学习作为一种无模型方法来探索弦真空的景观。作为一个具体的应用程序,我们利用一种称为“异步优势参与者评论家”的人工智能代理来研究与D6骨骼相交的IIA型致密化。通过更改D6-branes配置来探索不同的字符串背景配置,代理会收到与字符串一致性条件和接近标准模型真空相关的奖励和惩罚。这些反过来又被用来更新代理的策略并评估神经网络的价值,以改善其行为。通过强化学习,智能体在两项任务中的性能都得到了显着改善,对于某些任务,它发现解决方案的系数比随机助步器高200O\数学{O}(200)$$。在一个案例中,我们证明了该代理学习了一种人类发现策略来寻找一致的字符串模型。在
下载地址
用户评论