大数据面试宝典最新版本
1.inputformat在MapReduce程序的开发过程中,往往需要用到FileInputFormat与TextInputFormat,我们会发现TextInputFormat这个类继承自FileInputFormat,FileInputFormat这个类继承自InputFormat,InputFormat这个类会将文件file按照逻辑进行划分,划分成的每一个split切片将会被分配给一个Mapper任务,文件先被切分成split块,而后每一个split切片对应一个Mapper任务FileInputFormat的划分机制:A.简单地按照文件的内容长度进行切片B.切片大小,默认等于block大小C.切片时不考虑数据集整体,而是逐个针对每一
用户评论