2023年09月归档_坚定水杯的博客_Oracle,显卡,Apple Mac,ASP.NET,hadoop,Java数据结构,Python科学计算进阶,Think领域博主

坚定水杯

文章

资源

加入时间

4年2月16天

第四节课 hadoop总结

mapreduce优化总结1、通过修改map的切片大小控制map数量（尽量和block大小保持一致）并不是map越多越好，根据集群资源set mapred.max.split.size=2560000002、合并小文件。因为一个文件会至少生成一个map3、避免数据倾斜4、combine操作 map端的预聚合5、mapjoin操作 map小表广播6、适当备份，因为备份多可以本地化生成map任务yarn运行流程1、提交一个mapreduce mr运行需要资源，资源在rm中

hadoop 2023-09-05 146 点赞 2 评论 221 浏览

他的专栏

Oracle（0）

显卡（0）

Apple Mac（0）

ASP.NET（1）

hadoop（1）

Java数据结构（1）

Python科学计算进阶（1）

Think（1）

他的归档

2023年09月（1）

热门文章

发布asp.net core时如何修改ASPNETCORE_ENVIRONMENT环境变量

第四节课 hadoop总结

Java数据结构——队列与循环队列1、队列：2、循环队列：

73---numpy 布尔运算

证明曲线凹凸性的参数定义_20160421