大数据面试复习(一)之HDFS概况
目录 HDFS特点概况 HDFS核心组件的职责 HDFS数据流程 HDFS写数据流程 HDFS读数据流程 HDFS高可用 HDFS小文件问题 HDFS特点概况 特点: 廉价 流数据读取(流数据是一组顺序、大量、快速、连续到达的数据序列) 大数据集 跨平台 高延迟:换言之不适合低延迟平台 一次写入,多次读取的文件模型 无法高效存储大量小文件。(每个文件都需要一个元数据) 不支持多用户写入及任意修改文件。 HDFS核心组件的职责 HDFS集群包括,NameNode和DataNode以及Secondary Namenode。 NameNode负责管理整个文件系统的元数据,以及每一个
用户评论