颠覆大数据分析:基于Storm、Spark等Hadoop替代技术的实时应用

  • 颠覆大数据分析:基于Storm、Spark等Hadoop替代技术的实时应用
  • 所属分类:
    发货地:陇南
  • 价    格:38
  • 市场价格:
  • 今日价格: 有特价请联系
  • 优惠详情: 剩余数量总共数量
  • 最近热度:
  • 累计热度: 132
  • 综合得分:
  • 信誉得分:
  • 品牌:
  • 货号:d5ba5dc8e99
  • 立刻联系购买联系商家weiwen0225

        本商品由weiwen0225提供,通过weiwen0225完成交易,请放心购物

  • 书名:颠覆大数据分析:基于Storm、Spark等Hadoop替代技术的实时应用

本店发申通快递,如快递不到或其他原因要改发别的快递请提前客服!因库房变化大,请客服查询是否有现货再拍,谢谢!温馨提示 收货时请务必在快递员在场的情况下打开包装确认后签收。在快递单上签字确认将被视为您认为货物无损,家人、门卫等签收视同本人签收。若快递员不同意先确认后签收,应当在签字后立即在快递员在场的情况下打开包装查看,有问题请当时掌柜。正常签收后反映的外观破损等情况,我们将不予赔偿。

基本信息

书名:颠覆大数据分析:基于Storm、Spark等Hadoop替代技术的实时应用

原价:49.00

作者:(美)阿涅斯瓦  著,吴京润, 黄经业 译

出版社:电子工业出版社

出版日期:2015-5-1

ISBN(咨询特价)

字数:(咨询特价)

页码:218

版次:1

装帧:平装

开本:32开

商品重量:

编辑推荐


 

内容提要


本书每章一个主题,介绍了各种大数据分析技术与机器学习算法。本书能够让读者掌握
  大数据分析和机器学习的相关技术的大致脉络,为之后的进阶学习提供参考与指导。本书适合大数据技术入门者、希望对大数据技术有所了解,以及想要学习大数据技术但
  是不知道应该从何处入手的读者阅读。

目录


前言
致谢
关于作者
1 引言:为什么要超越 Hadoop Map-Reduce
Hadoop的适用范围
大数据分析之机器学习实现的
代机器学习工具/范式
第二代机器学习工具/范式
第三代机器学习工具/范式
小结
参考文献
2 何为伯克利数据分析栈(BDAS)
实现 BDAS的动机
Spark:动机
Shark:动机
Mesos:动机
BDAS的设计及架构
Spark:高效的集群数据处理的范式
Spark的性分布式数据集
Spark的实现
Spark VS分布式共享内存系统
RDD的表达性
类似 Spark的系统
Shark:分布式系统上的 SQL接口
Spark为 Shark提供的扩展
列内存存储
分布式数据加载
完全分区智能连接
分区修剪
机器学习的支持
Mesos:集群调度及管理系统
Mesos组件
资源分配
隔离
容错性
小结
参考文献
3 使用 Spark实现机器学习算法
机器学习基础知识
机器学习:随机森林示例
逻辑回归:概述
二形式的逻辑回归
逻辑回归估计
多逻辑回归
Spark中的逻辑回归算法
支持向量机
复杂决策面
支持向量机背后的数学原理
Spark中的支持向量机
Spark对 PMML的支持
PMML结构
PMML的生产者及消费者
Spark对朴素贝叶斯的 PMML支持
Spark对线性回归的PMML支持
在Spark中使用MLbase进行机器学习
参考文献
4 实现实时的机器学习算法
Storm简介
数据流
拓扑
Storm集群
简单的实时计算例子
数据流组
Storm的消息处理担保
基于Storm的设计模式
分布式远程过程调用
Trident:基于Storm的实时聚合
实现基于Storm的逻辑回归算法
实现基于Storm的支持向量机算法
Storm对朴素贝叶斯PMML的支持
实时分析的应用
工业日志分类
互联网流量过滤器
Storm的替代品
Spark流
D-Streams的动机
参考文献
5 图处理范式
Pregel:基于BSP的图处理框架
类似的做法
开源的Pregel实现
Giraph
GoldenORB
Phoebus
Apache Hama
Stanford GPS
GraphLab
GraphLab:多核版本
分布式的GraphLab
PowerGraph
通过 GraphLab实现网页排名算法
顶点程序
基于GraphLab实现随机梯度下降算法
参考文献
6 结论:超越Hadoop Map-Reduce的大数据分析
Hadoop YARN概览
Hadoop YARN的动机
作为资源调度器的 YARN
YARN上的其他框架
大数据分析的未来是怎样的
参考文献
附录 A代码笔记

 

 

作者介绍


Vijay Srinivas Agneeswaran 博士,1998 年于SVCE 的马德拉斯分校获得计算机科学与工程专业的学士学位,2001 年获取了印度理工学院马德拉斯分校的硕士学位(研究性质),2008年又获取了该校的博士学位。他曾在瑞士洛桑的联邦理工学院的分布式信息系统实验室(LSIR)担任过一年的博士后研究员。之前7 年先后就职于Oracle、Cognizant 及Impetus,对大数据及云领域的工程研发贡献颇多。目前担任Impetus 的大数据实验室的执行总监。他的研发团队在专利、论文、受邀的会议发言以及下一代产品创新方面都处于领导地位。他主要研究的领域包括大数据管理、批处理及实时分析,以及大数据的机器学习算法的实现范式。最近8 年来,他一直是计算机协会(ACM)以及电气和电子工程师协会(IEEE)的专家成员,并于2012年12 月被推选为IEEE 的资深成员。他在美国、欧洲以及印度的专利局都申请过专利(并持有美国的两项专利)。他在前沿的期刊及会议,包括IEEE transaction 上都发表过论文。他还竖内外多个会议的特邀发言人,譬如O’Reilly 的Strata 大数据系列会议。最近一次公开发表论文是在Liebertpub 的大数据期刊上。他与妻子及儿女一起居住在班加罗尔,对印度、埃及、巴比伦以及希腊古代的文化与哲学的研究非常感兴趣。

文摘


 

序言


 

热门相关信息