木子卜—个人博客

HDFS分布式文件系统

HDFS 是一个文件系统,用于存储文件,通过统一的命名空间—目录树来定位文件。其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。
HDFS设计理念
分而治之:将大文件、大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析;对同一个文件进行联合管理。每个小文件做冗余备份,并且分散到不同的服务器中,做到高可靠不丢失。为各类分布式运算框架(如:mapreduce,spark,tez,……)提供数据存储服务。

当前页面是本站的「Google AMP」版。查看和发表评论请点击:完整版 »