1. 首页
  2. 数据库
  3. 其它
  4. BeautifulSoup获取指定class样式的div的实现

BeautifulSoup获取指定class样式的div的实现

上传者: 2021-02-25 18:37:38上传 PDF文件 54.19KB 热度 6次
如何获取指定的标签的内容是解析网页爬取数据的必要手段,比如想获取 ...这样的div标签,通常有三种办法, 1)用字符串查找方法,然后切分字符串(或切片操作),如str.index(patternStr)或str.find(patternStr),这种方法快,但步骤多,因为要去头去尾。 2)用正则表达式,比如'([\s\S]+?)’,通过正则表达式的括号,可以获取匹配的内容,即之间的内容: import re def getTags(html): reg = r
下载地址
用户评论