MapReduce特性(四) 边数据分布
边数据:作业所需的额外的只读数据,辅助处理主数据集1 JobConf > Configuration类的setter方法 > Context.getConfiguration() > 如果是复杂的元数据,用户自定义序列化或者使用Stringifier类2 分布式缓存分布式缓存优于序列化边数据工作机制 > 用户启动作业,Hadoop使用-files -...