如果一个文件的大小超过了一张磁盘的大小,你该如何存储?转载如果一个文件的大小超过了一张磁盘的大小,你该如何存储?无论是在单机时代还是分布式时代,大规模数据存储都需要解决几个核心问题RAID技术RAID是如何解决关于存储的三个关键问题垂直伸缩和水平伸缩
转载转自 极客时间 从零开始学大数据 李智慧 文章, 我学完了做了个笔记总结了一下如果一个文件的大小超过了一张磁盘的大小,你该如何存储?单机时代,主要的解决方案是RAID;分布式时代,主要解决方案是分布式文件系统无论是在单机时代还是分布式时代,大规模数据存储都需要解决几个核心问题1.数据存储容量的问题。既然大数据要解决的是数以PB计的数据计算问题,而一般的服务器磁盘容量通常1~2TB,那么如何存储这么大规模的数据呢?2.数据读写速度的问题。一般磁盘的连续读写速度为几十MB,以这样的速度,几十PB