ohsumed语料库
OHSUMED数据集合由WilliamHersh和他的同事们一起建立,其文档来源于医药信息数据库MEDLINE10,它包含了从1987年到1991年五年间270个医药类杂志的标题和/或摘要,包含了348566个文档。
下载地址
用户评论
重新在微软Letor下下载了官方版
怎么使用啊,这个东西
okc文件用notepad++打开后发现并没有像相关资料中说的那样“每一个查询-文档对都被标注成相关(definitely relevant)、部分相关(partially relevant)或者不相关(not relevant),最终的标注结果中一共包含了2557个相关、2932 个部分相关以及12498 个不相关的查询-文档对(一个文档可能被标记成多个级别,在本节的实验中,取其级别最高的标号作为其最终标号)。” okc文件打开后排版有些混乱,能说一下怎么用吗
请问这个语料库,怎么用啊?
很棒这个语料集合对我很有帮助。。。。。。。
做毕业设计正要用,挺好的
这个资源挺难找的。
很好,挺不错的资源 数据集
这个OHSUMEN数据集在很多数值试验中都有应用,但是很少有提供该数据集,能在这里下载到真的很开心