作者 无与童比 原文地址:http://www.jianshu.com/p/3e79f8565ff7# 本文为原作者原创作品,转载需授权 从大三接触 Python 到现在几乎已经有两年的接触经验了,除去中间有一年左右接私活写写 Android 和 Lamp 之外,有 Python 实际项目开发经验也算是 9 个多月,也稍微算得上是一个入门级别的 Python 程序员了。 网上不乏一些不错的 Awesome list, 但是说实话,这种类型的清单某些程度上不就相当于推荐自己没有看过的书单? 而我对自己的 Awesome List 是有要求的。
我觉得这样的 Awesome List 比起那些涵盖各个方面的集合要好很多。
0x01. Python 库 我平时的开发以爬虫为主,Django 框架为辅,偶尔写写 Flask. 1.1. 爬虫类爬虫其实也并不是很需要技术水平的东西,对于小规模的爬虫,获取 - 解析 - 分析 - 入库即可。 只是抓取情景变化了之后,需要做的事情就是把各个模块解耦,甚至流程也在某种程度上发生了变化,变成了获取 - 入原始网页库 - 分析 - 入中间数据库 - 再获取 - 分析 - 入关系数据库。 在这个过程中,Python 中有很多很方便的库可以使用。 爬虫框架
当然,即便如此,也并不代表不需要编写定制自己的爬虫。
所以,下面是我在抓取解析分析入库这个流程中用到的工具第三方库: 爬虫分析网站常用:
爬虫获取常用:
爬虫解析常用:
数据库驱动
数据清洗与入库
数据提取与可视化
爬虫的部署与监控:
1.2. 网站开发类
由于并非专注开发 Flask 程序,所以不推荐 Flask 相关资源。 1.3. 其他 Python 库命令行工具:
小工具:
0x02. 网站 / 订阅 对于网站与订阅,求精不求多。
个人比较看东西找书或者是找代码的时候有两个习惯:
0x03. 书单 其实程序员的阅读量并不完全在纸质书上,主要在各种技术文章上,在各种官网的 Tutorial,Guide,API, 和 Source Code 上面,但是有一些书籍多读几遍还是很有帮助的。
0x04. 进阶源码单 书单是进阶的读者推荐给入门读者的读物。 源码单是进阶的程序员推荐给入门读者的读物。 下面是董明伟推荐的两个源码单: 初级 Pythoner 源码单
|
|
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系
[邮箱地址] 删除
|