一种自动社交标签的混合方法
由于社交标签在组织和访问网页方面的有效性,因此在网络上已变得越来越流行。 这篇简短的文章解决了自动社交标签的问题,该标签旨在自动预测网页的标签并帮助将来进行导航,过滤或搜索。 我们探索并找到了社交标签服务中协作标签的三个基础,即一致性,可共享性和稳定性。 在TF加权关键字提取,协作过滤方法和Corr-LDA(对应潜在Dirichlet分配)主题模型这三种众所周知的方法之间研究了互补优势。 然后,我们提出了一种用于自动社交标签的混合模型,以强调所有基础,该模型将三种方法生成的标签线性地组合在一起,并建立了一个排列概率模型来学习线性混合。 通过在Del.icio.us数据库中的50,000培训和10,000测试网页上进行的实验,结果表明我们的混合方法优于四个基准。 此外,与两种主题模型Corr-LDA和混合成员LDA相比,我们的方法分别使NDCG10改善了14.2%和25.6%。
下载地址
用户评论