参考资料熵简科技-李渔博士的报告《文本增强技术的研究进展及应用实践》背景本质上是增加少类样本(数量少或者类型单一)的数量具体场景包括少样本场景(如文本标注耗时耗力很难获取很多)分类任务中样本不均衡(note:常见方法-欠采样 ( undersampling ) 和过采样 ( oversampling ) 会对模型带来怎样的影响?)半监督训练(19年google半监督学习算法 UDA 可以看出[6],文本数据增强技术可以用在无标签样本上,以构造出半监督训练所需的样本对,以此让模型从无标签的.
技术问题
2024-05-23
35 点赞
0 评论
53 浏览