HDFS原理篇HDFS:实现原理:Hdfs架构:Hdfs写流程:Hdfs读流程:Hdfs块副本放置策略:Hdfs可靠性策略:
HDFS:为什么出现:一台机器不能存储下所有的数据是什么:分布式存储文件系统特点:高容错性(多备份) 批处理(移动计算,而不是移动数据;数据暴露给计算框架) 适合大数据处理(可也达到10K+节点) 流式文件(一次写入,多次读取;不可修改原有文件) 构建在廉价的机器上(多副本,高容错) 提高了磁盘的利用率(如果不切片进行存储,那么当需要拉去数据时,只