下载地址:
下载地址1资源简介:
中文名: Hadoop权威指南(第2版)原名: Hadoop: The Definitive Guide作者: (美)怀特译者: 周敏奇钱卫宁金澈清王晓玲资源格式: PDF版本: 扫描版出版社: 清华大学出版社书号: 9787302257585发行时间: 2011年7月4日地区: 大陆语言: 简体中文简介: 内容介绍: 《hadoop权威指南(第2版)》从hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍hadoop这一高性能处理海量数据集的理想工具。全书共16章,3个附录,涉及的主题包括:haddoop简介;mapreduce简介;hadoop分布式文件系统;hadoop的i/o、mapreduce应用程序开发;mapreduce的工作机制;mapreduce的类型和格式;mapreduce的特性;如何构建hadoop集群,如何管理hadoop;pig简介;hbase简介;hive简介;zookeeper简介;开源工具sqoop,最后还提供了丰富的案例分析。 《hadoop权威指南(第2版)》是hadoop权威参考,程序员可从中探索如何分析海量数据集,管理员可以从中了解如何安装与运行hadoop集群。 google帝国的基石是什么?mapreduce算法!开源项目hadoop作为它的一个具体实现,可以轻松用于构建和维护一个可靠性高、伸缩性强的分布式系统。 作者tomwhite作为hadoop的项目负责人,通过自己对hadoop和hadoop社区的理解,化繁为简,用浅显易懂的语言介绍了hadoop能做什么,怎么做才能充分发挥hadoop的优势,hadoop能够和哪些开源工具结合使用。这是一本主题丰富、讲解透彻的权威参考书,可帮助程序员了解分析海量数据集的细枝末节,帮助管理员掌握搭建和运行hadoop集群的具体过程。 经过修订和更新的第2版概述了hadoop的最新动态,例如hive、sqoop和avro等。书中还提供了案例分析来帮助读者了解如何用hadoop来解决具体的问题。如果想充分利用数据,从中挖掘出有价值的见解或者观点,毫无疑问,这本书将是您不可或缺的重要参考。 使用hadoop分布式文件系统(hdfs)来存储大型数据集,然后用mapreduce对这些数据集执行分布式计算 hadoop的数据和i/o构建块(用子压缩、数据完整性、序列化和持久处理) 探究mapreducc应用开发中常见的陷阱和高级特性 设计,构建和管理门adoop专用集群或在云上运行hadoop 使用pig这种高级的查询语言来进行大规模数据处理 使用hive(hadoop的数据仓库系统)来分析数据集 使用hbase(hadoop的数据库)来处理结构化数据和半结构化数据 深入介绍zookeeper,一个用子构建分布式系统的协作类型工具箱 目录: 第1章 初识hadoop 1第2章 关于mapreduce 15第3章 hadoop分布式文件系统 41第4章 hadoop i/o 75第5章 mapreduce应用开发 129第6章 mapreduce的工作机制 167第7章 mapreduce的类型与格式 189第8章 mapreduce的特性 225第9章 构建hadoop集群 259第10章 管理hadoop 293第11章 pig简介 321第12章 hive 365第13章 hbase 411第14章 zookeeper 441第15章 开源工具sqoop 477第16章 实例分析 497附录a 安装apache hadoop 565附录b cloudera's distribution for hadoop 571附录c 准备ncdc天气数据 573索引
飞网下载站,免费下载共享资料,内容涉及教育资源、专业资料、IT资源、娱乐生活、经济管理、办公文书、游戏资料等。