概述
Datawhale九月组队学习:情感分析
往期指路:
Task01情感分析BaseLine
Task02情感分析Upgrade
Task03情感分析Faster
Task04情感分析CNN
文章目录
- Datawhale九月组队学习:情感分析
- 前言
- 笔记要点
- 一、 模型搭建流程
- 二、 数据预处理要点记录
- 三、 模型搭建要点记录
- 总结
前言
本文是一个多分类的任务,前面的任务都是二分类任务,这里将对具有 6 个类的数据集执行分类。请注意,该数据集实际上并不是情感分析数据集,而是问题数据集,任务是对问题所属的类别进行分类。但是,本次学习中涵盖的所有内容都适用于任何包含属于 C C C 类之一的输入序列的示例的数据集。
笔记要点
一、 模型搭建流程
1、数据预处理
2、构建模型
3、训练模型
4、模型验证
二、 数据预处理要点记录
这里需要注意的是:
第一,我们不需要在 LABEL 字段中设置 dtype。在处理多类问题时,PyTorch 期望标签被数字化为LongTensor。
第二,这次我们使用的是TREC数据集而不是IMDB数据集。 fine_grained 参数允许我们使用细粒度标签(其中有50个类)或不使用(在这种情况下它们将是6个类)。
注意:TorchText中TREC的相关用法点这里
三、 模型搭建要点记录
我们将使用Task04中的CNN模型,但是教程中涵盖的任何模型都适用于该数据集。 唯一的区别是现在 output_dim 是 C C C维而不是 2 2 2维。
这里有了一个新的知识点:nn.ModuleList()函数,这里有一个简单的介绍:
将子模块保存在列表中。ModuleList 可以像常规 Python 列表一样索引,但它包含的模块已正确注册,并且所有 Module 方法都可以看到。原文链接
这里给大家推荐一个博主的文章,是关于 PyTorch 中的 ModuleList 和 Sequential: 区别和使用场景
总结
以上就是本文的所有内容了,继续加油呀~
最后
以上就是明理发夹为你收集整理的Datawhale九月组队学习--情感分析--Task05Datawhale九月组队学习:情感分析前言笔记要点总结的全部内容,希望文章能够帮你解决Datawhale九月组队学习--情感分析--Task05Datawhale九月组队学习:情感分析前言笔记要点总结所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复