1. 首页
  2. 考试认证
  3. 其它
  4. hzWikitaxonomyPeking University Wikipedia Project

hzWikitaxonomyPeking University Wikipedia Project

上传者: 2024-12-11 12:13:46上传 ZIP文件 268.86MB 热度 5次

hzWikitaxonomy 是一个由北京大学的 hanzhe 发起的维基百科相关项目,截止日期为 [1222]。项目计划包括以下几部分:

  1. 文档整理:后续计划涉及做 paraphrase 大作业代码(截止 [1221])。

  2. 分类归一化:处理页面分类 254517。

  3. 代码整理

  4. predicate 属性 迁移到 MySQL 存储,并改写 extract.predicateTable 代码。

  5. triple 迁移到 MySQL 数据库存储,并改写 extract.triple 代码。

  6. TimeTable

  7. 抽取三元组 (v1.1,20140819)

  8. predicate 正规化

    a. 特征抽取:

     (1) **upper_title 信息提取**
    
     (2) **link 信息提取**
    
下载地址
用户评论