nlp gym:NLPGym 开发RL代理以解决NLP任务的工具包 源码
NLPGym NLPGym是一个工具包,可以弥补RL和NLP应用程序之间的差距。 这旨在促进自然语言处理任务上DRL应用程序的研究和基准测试。 该工具包为标准NLP任务提供了交互式环境,例如序列标记,问题回答和序列分类。 序列标记 问题回答 多标签分类 序列标记:序列标记任务可以转换为MDP,其中给定的句子按从左到右的顺序进行解析。 在每一步骤中,一个令牌被呈现给代理。 代理可用的操作是使用可能的标签之一进行TAG标记。 到达句子结尾时,情节终止。 默认情况下,奖励功能基于实体级别F1分数。 它可以是剧集结尾处的稀疏,也可以是密集的,其中每一步的得分之间的变化都作为奖励给出。 多项选
用户评论