XML数据集成的安全问题
互联网上大量的信息是用表格来表示的,有很多程序需要自动理解和集成各个行业的HTML 表,比如信息存取,数据仓库和互联网挖掘。HTML 文件中的表是用HTML 语言写的,用户读起来很轻松,而计算机程序却很难获得其中的数据。并且不同的HTML表可能用不同的结构,不同的含义和不同的名字来存储数据,这给集成数据增添了很多麻烦。因此怎样从HTML 表中获得并集成数据是一个急需解决的问题。 分析了HTML, XML 和 JAVA 语言的特点,介绍了一种将Web数据中的表格转换成XML 文档的方法。该方法首先将HTML 表格转换为规范的表格,然后将规范的表格转换为XML 文档。最后是集成这些被转换的XML
用户评论
刚好能用得上,谢谢分享