1. 首页
  2. 数据库
  3. 其它
  4. 从Twitter数据集进行性别分类的自然语言处理NLP:借助自然语言处理NLP我可以从Twitter数据集中识别性别分类 源码

从Twitter数据集进行性别分类的自然语言处理NLP:借助自然语言处理NLP我可以从Twitter数据集中识别性别分类 源码

上传者: 2021-05-12 02:26:16上传 ZIP文件 3.03MB 热度 8次
高音数据集对性别分类的自然语言处理NLP 借助自然语言处理NLP,我可以从Tweeter数据集中识别性别分类 该文件包含: 加载数据集: 该数据集用于训练CrowdFlower AI性别预测器。 您可以在此处阅读有关该项目的所有信息。 要求参与者仅查看Twitter的个人资料并判断用户是男性,女性还是品牌(非个人)。 数据集包含20,000行,每个行都有一个用户名,一条随机鸣叫,帐户个人资料和图像,位置,甚至是链接和侧边栏颜色。 数据集来自这里: : 灵感 您可以尝试使用此数据集回答以下几个问题: 推文和个人资料中的单词如何预测用户的性别? 用什么词可以强烈预测男性或女性性别? 风格因素(例如链接颜色和侧边栏颜色)如何很好地预测用户的性别? 数据 数据集包含以下字段: unitid:用户的唯一ID _golden:模型的黄金标准中是否包含用户; 对或错 unitsta
用户评论