分布式文件系统HDFS的结构及运行
--内容来自厦门大学林子雨教授的《大数据技术原理》课程,作为学习笔记。分布式文件系统是大数据时代解决大规模数据存储问题的有效解决方案,HDFS开源实现了谷歌GFS,可以利用由廉价硬件构成的计算机集群实现海量数据的分布式存储; HDFS具有兼容廉价的硬件设备、流数据读写、大数据集、简单的文件模型、强大的跨平台兼容性等特点。缺点:不适合低延迟数据访问,无法高效存储大量小文件、不支持多用户写入,以...