1. 首页
  2. 数据库
  3. 其它
  4. python爬取2020国家科学技术奖励网站(正则表达式)调用docx转存word

python爬取2020国家科学技术奖励网站(正则表达式)调用docx转存word

上传者: 2020-12-31 07:27:24上传 PDF文件 57.25KB 热度 7次
因网站部分网页源码不够规范,所以选择正则表达式代替bs4,有同样需求的朋友可以看一哈~ 这里放上全部代码,但注释较少,有问题可以评论交流。 # -*- coding: utf-8 -*- import urllib.request import re import os from docx import Document from docx.shared import Inches from docx.oxml.ns import qn import pdb as pd def save2word(path,r1,r2,r3,r4,r5,r6): document = Document
下载地址
用户评论