我是靠谱客的博主 矮小小兔子,最近开发中收集的这篇文章主要介绍pytorch Sampler,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

对于iterable-style类型的dataset来说,数据的加载顺序是完全由用户定义的迭代器来确定的。

而对于map-style类型的dataset来说,数据的索引的加载顺序由torch.utils.data.Sampler类确定。例如当使用SGD进行网络训练的时候,sampler会自动生成乱序的序列(相对数据读取的顺序),然后每次从中选择一个进行读取,或者选择一个batch进行mini-batch SGD训练。

torch.utils.data.distributed.DistributedSampler:一个在总体数据集的一个子集中采样的采样器。

参数:

  • dataset:用来sample的数据集
  • num_replicas(optional):参与分布式训练的进程数
  • rank(optional):当前运行进程的编号
  • shuffle(optional):如果为真,sampler将会打乱索引

https://pytorch.org/docs/stable/data.html#iterable-style-datasets
https://pytorch.org/docs/stable/data.html#torch.utils.data.Sampler

最后

以上就是矮小小兔子为你收集整理的pytorch Sampler的全部内容,希望文章能够帮你解决pytorch Sampler所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(41)

评论列表共有 0 条评论

立即
投稿
返回
顶部