概述
对于iterable-style类型的dataset来说,数据的加载顺序是完全由用户定义的迭代器来确定的。
而对于map-style类型的dataset来说,数据的索引的加载顺序由torch.utils.data.Sampler类确定。例如当使用SGD进行网络训练的时候,sampler会自动生成乱序的序列(相对数据读取的顺序),然后每次从中选择一个进行读取,或者选择一个batch进行mini-batch SGD训练。
torch.utils.data.distributed.DistributedSampler:一个在总体数据集的一个子集中采样的采样器。
参数:
- dataset:用来sample的数据集
- num_replicas(optional):参与分布式训练的进程数
- rank(optional):当前运行进程的编号
- shuffle(optional):如果为真,sampler将会打乱索引
https://pytorch.org/docs/stable/data.html#iterable-style-datasets
https://pytorch.org/docs/stable/data.html#torch.utils.data.Sampler
最后
以上就是矮小小兔子为你收集整理的pytorch Sampler的全部内容,希望文章能够帮你解决pytorch Sampler所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复