我是靠谱客的博主 矮小小兔子,这篇文章主要介绍pytorch Sampler,现在分享给大家,希望可以做个参考。

对于iterable-style类型的dataset来说,数据的加载顺序是完全由用户定义的迭代器来确定的。

而对于map-style类型的dataset来说,数据的索引的加载顺序由torch.utils.data.Sampler类确定。例如当使用SGD进行网络训练的时候,sampler会自动生成乱序的序列(相对数据读取的顺序),然后每次从中选择一个进行读取,或者选择一个batch进行mini-batch SGD训练。

torch.utils.data.distributed.DistributedSampler:一个在总体数据集的一个子集中采样的采样器。

参数:

  • dataset:用来sample的数据集
  • num_replicas(optional):参与分布式训练的进程数
  • rank(optional):当前运行进程的编号
  • shuffle(optional):如果为真,sampler将会打乱索引

https://pytorch.org/docs/stable/data.html#iterable-style-datasets
https://pytorch.org/docs/stable/data.html#torch.utils.data.Sampler

最后

以上就是矮小小兔子最近收集整理的关于pytorch Sampler的全部内容,更多相关pytorch内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(140)

评论列表共有 0 条评论

立即
投稿
返回
顶部