Storm是最流行的实时计算框架,它被认为是Hadoop批处理计算的补充,它比Map/Reduce更加灵活,而且性能、可靠性和可扩展性出众,所以在Twitter等互联网公司被广泛应用到大数据实时和准实时处理的生产环境。 Storm是一个分布式的、可靠的实时计算系统。与Hadoop的批处理不同,Storm采用流式的消息处理方法,它使得消息可以得到快速的处理,可以用于实时性要求较高的系统,例如广告点击的在线统计等。Storm弥补了Hadoop在实时处理方面的缺陷,目前被各大互联网公司广泛使用并日益流行。今天跟大家分享的这本讲解Storm的书有什么特色呢? 《Storm源码分析》是第一本深入介绍Storm的图书,从源代码的角度详细剖析了Storm的设计与实现。这本书适合各类型的计算机工作者,初学者可以通过本书来学习如何实现一个可靠的、高容错性的、实时的分布式处理平台。而对于Storm用户来讲,这本书不仅可以帮助他们更深入地了解这套系统的工作原理,还可以帮助他们正确地使用该平台,也有利于实现对Storm的二次开发。鉴于Storm是基于Clojure和Java开发的,所以需要读者对这两种语言有一定的了解。 这本书主要分析阐述了Storm的底层架构,例如Nimbus、Supervisor、Worker、Executor以及Task,并对Storm如何实现可靠的消息传输进行了系统讨论,例如事务Topology以及Trident。 书中对Storm的最新源代码进行了系统而详尽的分析,读者在阅读过程中一定会获益匪浅。 这本书讲解的主题如下: 第1章 网站目标的可视化 第2章 搭建Storm集群 第3章 Storm编程基础 第4章 基础函数和工具类 第5章 通信机制 第6章 Nimbus 第7章 Supervisor 第8章 Scheduler 第9章 Worker 第10章 Executor 第11章 Task 第12章 Storm的Ack框架 第13章 系统运行统计 第14章 系统运行统计的另一种实现 第15章 事务Topology的实现 第16章 事务Topology示例 第17章 Trident的Spout节点 第18章 Trident的存储 第19章 Trident消息 第20章 Trident操作与处理节点 第21章 Trident流的基本操作 第22章 Trident中流的交互操作 第23章 Trident中的Bolt节点 第24章 Trident的执行优化 第25章 Trident与DRPC 第26章 Trident的Topology构建器 第27章 多语言 第28章 Storm中的配置项 看他们如何评价 流计算是目前计算机领域非常热门的技术,Storm平台的出现大大推进了该项技术的发展,并被很多包括微软在内的大公司采用。《Storm源码分析》从源代码角度深入浅出地分析了Storm的设计及实现,一方面可以使读者更好地了解并用好Storm技术,另一方面可以让读者学习如何设计大规模分布式系统,相信读者一定会受益匪浅。 于伟,微软资深开发总监 在当今互联网众多领域中,大数据和云计算无疑是两个最火的主题,而当中尤其以大数据的实时流处理为很多开发者都感兴趣的。作者在书中对Storm进行了详尽的介绍,按部就班,化繁为简,让读者能一步一景地学懂Storm的个中细节,实在是Storm入门者的必备良药。 章英基,阿里巴巴资深总监 点击左下角【阅读原文】去图灵社区阅读第1章内容。 本文转载自:微信公众账号 - 图灵教育,版权归原作者所有! |
|
声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系
[邮箱地址] 删除
|