| 关键词: 课程 Python 程序 文件夹 关键词 命令 视频 乱码 Crawler 目录 |
中国大学 MOOC 是网易旗下一款慕课视频教育网站。实话说,这是网易几款教育类产品中,我最喜欢的一个。自己也使用了一年多,观看视频都是需要联网的,但部分 MOOC 课程存在有效期,设定的学期结束即无法观看。 Course Crawler 这个爬虫工具的出现,则提供了极大的便利。 ![]() 准备第一步:安装 Python 3 环境 进入 Python 3 官网(https://www.python.org/downloads/),选择合适的版本下载安装即可。 第二步:通过 pip 安装程序要用到的3个运行库: 打开 Python 的安装目录,进入到 Scripts 目录(我这里是 ![]() 在打开的命令行窗口中输入 ![]() 第三步:从 Github 下载最新的 Course Crawler 程序包,并解压。 到此为止,运行环境和软件均已准备完成。 使用解析课程资源如下图所示,打开你需要下载的课程详情页(并非课程学习页),复制课程网址。 ![]() 在解压出来的程序包文件夹内,用同样的方式打开命令行,并输入 ![]() 回车后,程序随即开始解析课程资源。 等待解析完成后,我们可以在程序目录下发现以刚才课程命名的文件夹。文件夹内通常会有 Files, PDFs, Texts 三个子文件夹,和 Outline.txt, Rename.bat, Videos.txt 三个文件(具体视课程内容而定)。 ![]() 其中 Files, PDFs, Texts 分别为老师上传的附件、课件、富文本,爬虫已经替你下载好了。而 Outline.txt 和 Rename.bat 分别是课程资源的结构和重命名程序,这两个我们不要动,之后会用到。 下载和整理课程视频![]() 看到乱码的视频文件名,我想你应该能够猜到刚才两个文件的作用了吧!没错,等到视频都下载完成后,我们把所有乱码的 mp4 文件移动到刚才的课程目录,然后双击打开 Rename.bat ,稍等命令行闪过几秒,就可以看到,原来乱码的视频都变成了标准的小课程名。 关于程序项目官网:https://mooc.xoy.io Github 页面:https://github.com/Foair/course-crawler 原文:https://www.kiwiape.cn/tech/2018/08/01/download-icourse163-with-course-crawler.html 作者:kiwiape 回复下方「关键词」,获取优质资源 回复关键词「 pybook03」,立即获取主页君与小伙伴一起翻译的《Think Python 2e》电子版 回复关键词「入门资料」,立即获取主页君整理的 10 本 Python 入门书的电子版 回复关键词「m」,立即获取Python精选优质文章合集 回复关键词「book 数字」,将数字替换成 0 及以上数字,有惊喜好礼哦~ 题图:pexels,CC0 授权。 |
| 本文出处: https://www.toutiao.com/a6754923916621251086/ |
|
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系
[邮箱地址] 删除
|