Neural Contextual Bandits with Deep Representation and Shallow Exploration 我们研究了一类一般的情境强盗,其中每个情境动作对都与一个原始特征向量相关联,但奖励生成功能未知。我们... 大小:635.84 KB | 2021-01-24 03:50:46