1. 首页
  2. 数据库
  3. 其它
  4. Company Classification using RoBERTa:基于使用Transformer架构的公司的文本信息的多类别分类(62个类别) 源码

Company Classification using RoBERTa:基于使用Transformer架构的公司的文本信息的多类别分类(62个类别) 源码

上传者: 2021-02-23 15:43:54上传 ZIP文件 36.22MB 热度 3次
问题陈述 给定Company Name和Business Description ,任务是将公司分类。 共有62个类别 方法 删除重复的条目 跨类别的Wordcloud可视化 具有BOW和多项朴素贝叶斯的基线模型分别获得F-1和AUC分数分别为0.59和0.685 。 训练20时期后, RoBERTA的F-1和AUC分数分别为0.743和0.847的情况得到改善。
用户评论