有毒评论分类:使用BERT转移学习对文本进行多标签分类不平衡数据的重新采样 源码
使用预训练的Google BERT模型对有毒评论(Kaggle的竞争数据集)进行多标签分类 keras-bert.ipynb :在Google的BERT模型的顶部微调一个多标签分类器(固定其参数)。 将Hamming损失与自定义定义的召回率指标一起使用(衡量分类器正确预测的阳性标签的比例),以评估分类器的性能。 use-model.ipynb :使用微调的多标签分类器进行预测 colab-tpu :文件夹包含用于在Colab TPU上训练模型的笔记本(注意:在对Colab TPU进行训练之前,向GCS存储桶授予匿名读取权限) data_prepare.ipynb :准备数据并将其保存到Tf
下载地址
用户评论