首页 存档 技术 查看内容

【杭州站】Python大数据分析培训

2018-3-30 13:00 |来自: 互联网 445 0

摘要: Python简洁优雅、灵活开源,在2011年1月被TIOBE编程语言排行榜评为2010年度语言,之后也长期位居排行榜前五,与R共同成为大数据和人工智能时代数据分析和机器学习领域最受数据科学家欢迎的语言。 Python的功能十分 ...

Python简洁优雅、灵活开源,在20111月被TIOBE编程语言排行榜评为2010年度语言,之后也长期位居排行榜前五,与R共同成为大数据和人工智能时代数据分析和机器学习领域最受数据科学家欢迎的语言。

Python的功能十分强大,在数据挖掘、数据分析、Web开发、网络爬虫、游戏开发、量化金融等领域都有完备且成熟的开源方案。然而,作为当今最热门的编程语言之一,除其开发功能之外,Python在大数据分析领域的功能没有得到足够的重视。

鉴于对未来市场的评估与分析,由上海数萃大数据科技有限公司主办的Python大数据分析培训定于2017818日-22日在杭州举办。本次培训旨在为从事数据分析与研究的从业人员及高校教师提供从Python入门、常用工具库到数据的统计分析、可视化、数据挖掘、机器学习及实际案例的学习与实践机会。培训具体内容如下:

培训课程

模块一

1讲:

数据分析方法概述及相关工具

1.认识数据

2.数据分析的步骤和原则(确定/分解/评估/决策)

3.相关工具概述及对比(excel/spss/R/matlab/python/Java)

2讲:

python环境和基础语法

1.安装anaconda套件

2.基本数据结构(列表/字符串/字典)

3.基本语法(条件/循环/函数//模块)

4.Python语言编程的最佳实践经

5.Python爬虫

6.最简单的制作python包的方法

7.python在业界的应用案例分享

3讲:

基础工具库

1.基础环境linux/ipython

2.数值计算numpy

3.绘图与可视化matplotlibChart

4.数据操作pandas

5.高级应用案例分享

模块二

4讲:

统计分析库

1.概率和统计分析statsmodels

2.科学计算和最优化scipy

3.线性回归和逻辑回归statsmodels

5讲:

数据挖掘览

1.数据挖掘与模型

2.建模流程和步骤

3.常见算法

4.高级应用案例解析

6讲:

典型数据挖掘项目示范

1.基于titanic数据集预测生存概率

2.演示如何进行绘图探索

3.特征处理和建模

模块三

7讲:

数据挖掘与机器学习

1.感知机

2.决策树

3.特征工程

4.正则化方法

5. PCA

8讲:

机器学习进阶

1.参数调优

2.集成学习

3.文本挖掘

4.神经网络

5.深度学习

9讲:

数据挖掘案例讲解

1.基于MNIST数据集识别数字

2.展示如何进行特征构造

3.常规机器学习算法和深度学习算法的效果差异

4.机器学习的结果评估

5.深度学习的最新进展分享

10讲:

现代分析技术的应用(选修)

1.社交网络分析

2.空间数据的展示与地理信息分析

3.图像分析技术简介

模块四

11讲:

网络爬虫基础

1.网络爬虫技术基础

2.基础Python爬虫库(urllib/Requests)

3.文件读取与保存

4.认识正则表达式

5.“漂亮”的爬虫库-Beautiful Soup

6.静态网页爬取案例分享

12讲:

网络爬虫进阶

1.AjaxDHTML网站爬取

2.Selenium与“幻影”浏览器-PhantomJS

3.动态网页爬取案例分享

4.更多网络爬虫技术

13讲:

基于R的爬虫

1.再议爬取与解析

2.经典组合:RCurlXML

3.爬虫新贵:rvest

4.基于PythonR的爬虫对比


讲师介绍

肖凯

数萃首席科学家,数据挖掘专家,10多年的R语言和python数据挖掘应用经验,国内使用Python作为数据处理工具的先行者,BAT工作背景目前在中国最大的电子商务与金融服务企业担任数据中心高级分析师、高级项目经理。《数据科学中的R语言》作者之一,翻译并出版数据挖掘与机器学习专著两部。曾担任1号店商务智能部资深数据挖掘工程师,“数据科学中的Rpython”博客博主,精通python、R等多种工具进行数据挖掘分析,拥有深厚的算法推导及代码实现能力,具有丰富的数据挖掘与机器学习方面的授课经验。

尹志

数据科学家,数萃大数据学院讲师,浙江大学物理学博士,青年学者,浙江宁波工程学院深度学习研究中心负责人;某网络科技上市公司大数据总监,10 年软件开发数据产品经验,熟悉R\Python\Javascript等多种编程语言;目前研究集中在推荐系统、文本挖掘、神经网络等机器学习领域;具有丰富的统计建模、数据挖掘、大数据技术授课经验。

金宏

加拿大海归。5 R语言和Python数据挖掘应用经验。任职BAT,有丰富的统计建模、数据挖掘经验。


培训对象

想深入了解Python并实现数据分析和挖掘的数据分析师

想使用Python实现机器学习的工程师

希望了解和学习使用Python进行大数据分析的编程爱好者

高校数据挖掘与机器学习任课老师

想利用Rpython进行网络爬虫的数据僧

培训安排

培训地点:浙江杭州

报到:2017818

授课:

模块一至三:2017819-21

模块四:2017822

报名方式

报名通过网站进行,点击下方“阅读原文”可直接报名

报名截止日期:2017818

联系方式

联系人:李璇,电话18930310912

联系邮箱:[email protected]


培训费用

前三个模块3600元/人,模块四1500元,全部模块4800元(含培训费、教材费、证书费、场地等相关费用),食宿统一安排,费用自理。

优惠:老学员8折,学生7,新学员(包括学生)5人以上9折。

上海数萃大数据科技有限公司

201774






数萃大数据:sh-vad
一个专注做大数据培训、资料分享的平台



声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系 [邮箱地址] 删除

路过

雷人

握手

鲜花

鸡蛋

相关分类

返回顶部