1. 首页
  2. 数据库
  3. 其它
  4. Multiclass Multilabel prediction For stack overflow Questions___Surendran_R 源码

Multiclass Multilabel prediction For stack overflow Questions___Surendran_R 源码

上传者: 2021-04-18 22:03:09上传 ZIP文件 14.72KB 热度 10次
StackOverflow问题的多类多标签预测 作者:Surendran R 数据集: : 目标:给定StackoverFlow帖子中“问题”的文本,预测与其相关的标签。 这是按比例缩小的版本,仅预测最常出现的前10个标签 程式语言:Python 模型架构:使用CNN(Conv1D)进行深度学习 关于数据集 数据集包含来自Stack Overflow编程问答网站的问题,答案和相应标签的文本。 这被组织为三个文件: 问题包含所有未删除的堆栈溢出问题的标题,正文,创建日期,截止日期(如果适用),分数和所有者ID。 标签包含每个问题的标签。 答案包含这些问题的每个答案的正文,创建日期,分数和所有者ID。 ParentId列链接回到“问题”表。我们不使用此文件,因为我们要根据给定的问题来预测标签 脚步: 步骤1:下载数据集 解压缩数据集 如下将数据加载到数据框中 questions_df a
下载地址
用户评论