1. 首页
  2. 数据库
  3. 其它
  4. python对html过滤处理的方法

python对html过滤处理的方法

上传者: 2021-02-01 07:29:32上传 PDF文件 35.21KB 热度 24次
如下所示: ##过滤HTML中的标签 #将HTML中标签等信息去掉 #@param htmlstr HTML字符串. def filter_tags(htmlstr): #先过滤CDATA re_cdata=re.compile('//<!\[CDATA\[[^>]*//\]\]>',re.I) #匹配CDATA re_script=re.compile('<\s*script[^>]*>[^<]*<\s*/\s*script\s*>',re.I)#Script re_style=re.compile('<\s*style[^>]*>[^<]*&l
用户评论