Santa_2020_Bandit_Jehan:我向2020年圣诞老人竞赛提交的作品 糖果手杖竞赛Kaggle比赛 源码
Santa_2020_Jehan 我对2020年圣诞老人竞赛的提交-甘蔗蔗糖竞赛Kaggle竞赛 TODO:D-Lin-UCB和TS(和TS-postdiff)的说明 我在这里添加了很多算法。TS和UCB是从一些非常有用的startercode笔记本中复制的,这些笔记本在比赛中被其他人推崇。 我以其他方式使它们适应,以产生贪婪,电子贪婪,D-UCB甚至是D-线性UCB(与此相关的线性代数很有趣)。 到目前为止,来自的Thompson采样(略有折扣)似乎发挥了最大作用! 我在这里找到的D线性UCB: : 它仍然是非上下文的(我们没有任何上下文信息),因此,实际上,这仅仅是实现它的乐趣而已,而不是实际使用它。 我还添加了一个有趣的小合奏,认为尽早的贪婪可能会使普通TS在快要快结束时有所提升! 我从这篇论文中得到了这个主意: (多武器多武装匪徒中贪婪算法的不合理有效性) 我测
下载地址
用户评论