Hadoop大数据平台架构与实践

上传:qq_86226 浏览: 28 推荐: 0 文件:PDF 大小:568.53KB 上传时间:2021-02-25 04:45:32 版权申诉
可靠的、可扩展的、分布式计算开源软件。ApacheHadoop软件库是一个框架,允许使用简单的编程模型,在计算机集群分布式地处理大型数据集。它可以从单个服务器扩展到数千台机器,每个机器都提供本地计算和存储。每一台计算机都容易出现故障,库本身的目的是检测和处理应用层的故障,因此在一组计算机上提供高可用性服务,而不是依靠硬件来提供高可用性。HadoopDistributedFileSystem(HDFS):一个分布式文件系统,它提供对应用程序数据的高吞吐量访问。HadoopYARN:作业调度和集群资源管理的框架。HadoopMapReduce:基于YARN的大型数据集并行处理系统。
上传资源
用户评论