股票买卖最佳时机leetcode Stock Trading Bot RL交易代理
股票买卖最佳时机leetcode强化学习股票交易机器人概括该笔记本使用强化学习实现了股票交易机器人。使用深度神经网络来获得最佳结果。应用程序接口Yahoo Finance API用于获取在大多数主要证券交易所上市的股票的最新每日股价。强化学习算法以使用“n天”状态表示为中心。我发现最好为此目的使用10天。每次迭代(或一天),代理都会评估此状态表示并确定当天的最佳行动方案(买入/卖出/持有)。它还为第二天形成一个新的状态表示。神经网络和优化损失神经网络是一个相当小而简单的网络,只有两个密集层。我试图保持网络简单以减少训练时间并允许快速获得结果,但是,改变网络架构可能会改善结果。损失使用MSE计算并使用SGD进行优化。事实证明,SGD对这个机器人非常有效,并且在未来的迭代中似乎很有希望。每个小批量(目前为64天)后都会调整参数,增加频率会显着增加训练时间。下一步是什么我需要将这个模型的结果与简单地购买和持有股票进行比较,并用过去几年表现不佳的股票进行测试。如果该模型在这些情况下无法叠加,我将首先尝试重新调整神经网络,
用户评论