coursera spider 一个简单的蜘蛛,用于抓取Coursera视频和pdf链接以及下载器脚本
Coursera Spider 是一个非常实用的工具,专门用来抓取豆瓣网站上列出的前100部电影名称。其使用方法简单,能够帮助用户快速获取所需的数据。
- 安装
您需要通过以下命令克隆该工具的GitHub仓库:
```bash
git clone git@github.com:Andrew-liu/Coursera_Spider.git
```
- 使用
安装完成后,您可以通过以下命令运行该工具:
```bash
python coursera.py pkuco-001
```
在这个命令中,最后一个参数为课程地址,用户可以根据自己的需求进行修改。
- 示例输出
运行上述命令后,工具将提示输入您的邮箱和密码,以完成登录操作。登录成功后,工具会读取网页内容,并通过正则匹配完成抓取工作。输出结果通常如下:
```bash
Coursera git:(master) ✗ python coursera.py pkuco-001
Input your Email > User_name
Input your Password > 登录成功...
读取网页成功...正则匹配结束...下载链接的长度56 h
```
为了更好地理解并掌握正则匹配在这个工具中的应用,您可以参考以下资源来进一步学习相关技术:
-
coursera dl下载Coursera.org视频和命名它们的脚本.zip 提供了一个用于下载和命名Coursera.org视频的脚本。
-
python正则匹配抓取豆瓣电影链接和评论代码分享 包含了抓取豆瓣电影链接和评论的代码示例。
-
正则匹配工具 提供了常用的正则匹配工具,帮助您更高效地处理类似任务。
下载地址
用户评论