1. 首页
  2. 考试认证
  3. Linux/Unix认证
  4. 网页解析器

网页解析器

上传者: 2020-09-11 22:07:02上传 PDF文件 2.34MB 热度 17次
本文详细介绍了网页信息解析的各种技术手段,并且针对新闻网页,提出了两种解析方案:一.采用面向对象的设计理念,提出了基于模板的网页信息抽取方案;二.提出了基于网页结构分析的信息抽取方案。文中详细讨论了这两套系统的算法及其实现,并探讨了两套系统各自的有缺点。最后并提出了一些新的设想、展望、以及改进方案。
用户评论
码姐姐匿名网友 2020-09-11 22:07:03

介绍的很详细,便于学习实现。