基于注意的BiLSTM CRF方法用于文档级化学命名实体识别
动机:在生物医学研究中,化学是一类重要的实体,化学命名实体识别(NER)是生物医学信息提取领域中的一项重要任务。 但是,大多数流行的化学NER方法都基于传统的机器学习,其性能在很大程度上取决于特征工程。 而且,这些方法都是句子级的,存在标注不一致的问题。结果:本文提出了一种神经网络方法,即基于注意的双向长短期记忆,带有条件随机字段层(Att- BiLSTM-CRF),以文档级化学NER表示。 该方法利用了由关注机制获得的文档级全局信息,以在文档中同一令牌的多个实例之间实施标记一致性。 在BioCreative IV化学化合物和药物名称识别(CHEMDNER)语料库以及BioCreative V化学疾病关系(CDR)任务语料库(F分数)方面,与其他最新技术相比,它几乎不需要任何特征工程就能实现更好的性能。分别为91.14和92.57%)。
用户评论