1. 首页
  2. 数据库
  3. 其它
  4. fathom:从网页中提取含义的框架 源码

fathom:从网页中提取含义的框架 源码

上传者: 2021-04-08 22:41:04上传 ZIP文件 904.65KB 热度 12次
捉摸 Fathom是一种监督式学习系统,用于识别网页的某些部分(弹出窗口,地址表,幻灯片)或对页面进行整体分类。 DOM流入一侧,而DOM节点流出另一侧,并标记有类型和这些类型正确的概率。 类似Prolog的语言可以很容易地指定建议每种类型的“气味”,而基于神经网络的培训师可以确定每种气味的最佳贡献。 最后,FathomFox Web扩展使您可以收集和标记一系列网页以进行培训。 继续阅读 。
用户评论