hadoop+hive 做数据仓库 & 一些测试
转载标明 :www.bagbaby.cn http://hi.baidu.com/dd_shop背景需求和现状目前的日志系统还称不上系统,只是在几台服务器上存着所有的日志,依靠NFS共享数据,并运算,带来的问题诸多:a) 数据存放凌乱,缺乏系统的目录管理;b) 存储空间有限,并且扩展非常麻烦;c) CV/PV等日志分散存放,合并不方便;d) 媒体服务日志数据集中存放