第四次作业：猫狗大战挑战赛目录前言第一部分在谷歌 Colab 上完成猫狗大战VGG模型的迁移学习第二部分用比赛测试集进行测试并生成CSV文件提交第三部分进行优化第四部分总结

336 阅读 0 评论 222 点赞

我是靠谱客的博主开心太阳，这篇文章主要介绍第四次作业：猫狗大战挑战赛目录前言第一部分在谷歌 Colab 上完成猫狗大战VGG模型的迁移学习第二部分用比赛测试集进行测试并生成CSV文件提交第三部分进行优化第四部分总结，现在分享给大家，希望可以做个参考。

前言

我们将建一个模型来完成 Kaggle 中的猫狗大战竞赛题目。在这个比赛中，有25000张标记好的猫和狗的图片用做训练，有12500张图片用做测试。首先在谷歌 Colab 上完成猫狗大战VGG模型的迁移学习，关键步骤截图，并附一些自己想法和解读。

在该代码的基础上，下载AI研习社“猫狗大战”比赛的测试集，利用fine-tune的VGG模型进行测试，按照比赛规定的格式输出，上传结果在线评测。将在线评测结果截图，将代码实现的解读发在博客。同时，分析使用哪些技术可以进一步提高分类准确率。

第一部分在谷歌 Colab 上完成猫狗大战VGG模型的迁移学习

1. 检查是否有GPU

在这里插入图片描述

2. 下载数据

下载数据并解压到工作目录
在这里插入图片描述

3. 数据处理

在这里插入图片描述
datasets 是 torchvision 中的一个包，可以用做加载图像数据。它可以以多线程的形式从硬盘中读取数据，使用 mini-batch 的形式，在网络训练中向 GPU 输送。在使用CNN处理图像时，需要使用transforms进行中心位置裁剪、转换为张量和归一化。图片将被整理成2242243的大小，同时进行了归一化处理。

然后使用datasets.ImageFolder加载数据，把训练集和验证集分别加载并使用transforms进行处理，最后放到一个字典里。并且获取数据集大小和训练集的类别
在这里插入图片描述

使用DataLoader将训练集的batch设为64，并打乱；验证集batch为5，不用打乱

在这里插入图片描述

4. 创建 VGG Model

torchvision中集成了很多在 ImageNet （120万张训练数据）上预训练好的通用的CNN模型，可以直接下载使用。

在本课程中，我们直接使用预训练好的 VGG 模型。同时，为了展示 VGG 模型对本数据的预测结果，还下载了 ImageNet 1000 个类的 JSON 文件。

在这部分代码中，对输入的5个图片利用VGG模型进行预测，同时，使用softmax对结果进行处理，随后展示了识别结果。可以看到，识别结果是比较非常准确的。

在这里插入图片描述

5. 修改最后一层，冻结前面层的参数

我们的目标是使用预训练好的模型，因此，需要把最后的 nn.Linear 层由1000类，替换为2类。为了在训练中冻结前面层的参数，需要设置 required_grad=False。这样，反向传播训练梯度时，前面层的权重就不会自动更新了。训练中，只会更新最后一层的参数。
把原网络的分类器的第六层改为nn.Linear(4096, 2)

在这里插入图片描述

6. 训练并测试全连接层

包括三个步骤：第1步，创建损失函数和优化器；第2步，训练模型；第3步，测试模型。

在这里插入图片描述
损失函数 NLLLoss() 的输入是一个对数概率向量和一个目标标签. 它不会为我们计算对数概率，适合最后一层是log_softmax()的网络。梯度下降使用随机梯度下降。

在这里插入图片描述

7. 可视化模型预测结果（主观分析）

主观分析就是把预测的结果和相对应的测试图像输出出来看看，一般有五种方式：

随机查看一些预测正确的图片
随机查看一些预测错误的图片
预测正确，同时具有较大的probability的图片
预测错误，同时具有较大的probability的图片
最不确定的图片，比如说预测概率接近0.5的图片

第二部分用比赛测试集进行测试并生成CSV文件提交

在这里插入图片描述

只有95.65，因此还有很大优化空间。

第三部分进行优化

### 1. 进行优化（小训练集）

for param in model_vgg_new.parameters():
    param.requires_grad = False
model_vgg_new.classifier._modules['6'] = nn.Linear(4096, 4096)
model_vgg_new.classifier._modules['7'] = nn.LeakyReLU(0.2, inplace=True)
model_vgg_new.classifier._modules['8'] = nn.Dropout(p=0.5,inplace=False)
model_vgg_new.classifier._modules['9'] = nn.Linear(4096, 2)
model_vgg_new.classifier._modules['10'] = torch.nn.LogSoftmax(dim = 1)

这里在原来的网络后面又加了一个Linear(4096, 4096)全连接层，参照了VGG19后面的两个大的全连接层。并且使用了LeakyReLU激活函数，Dropout防止过拟合。

在这里插入图片描述

import shutil

def classify_pics(dir_name):
  path = "./cat_dog/" + dir_name + "/"
  cat = path + "cat"
  dog = path + "dog"

  if not os.path.exists(cat):
    os.makedirs(cat)
  if not os.path.exists(dog):
    os.makedirs(dog)

  files = os.listdir(path)
  for file in files:
    if not os.path.isdir(file):
      name = os.path.splitext(file)[0].split('_')[0]
      if name == 'cat':
        shutil.move(path+file, cat)
      elif name == 'dog':
        shutil.move(path+file, dog)

classify_pics("train")
classify_pics("valid")

path = "./cat_dog/test/"
raw = path + "raw"

if not os.path.exists(raw):
  os.makedirs(raw)
files = os.listdir(path)
for file in files:
  if not os.path.isdir(file):
    shutil.move(path+file, raw)

normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])

vgg_format = transforms.Compose([
        transforms.CenterCrop(224),
        transforms.ColorJitter(brightness=0.15,contrast=0.15,saturation=0.15,hue=0), #调整亮度、对比度、饱和度、色相
        transforms.RandomRotation(5), #随机旋转
        transforms.ToTensor(),
        normalize,])

data_dir = './dogscats'

dsets = {x: datasets.ImageFolder(os.path.join(data_dir, x), vgg_format)
         for x in ['train', 'valid']}

dset_sizes = {x: len(dsets[x]) for x in ['train', 'valid']}
dset_classes = dsets['train'].classes

这里通过训练集中图片名称对图片进行分类，并且对图片进行增强，调节亮度、对比度、饱和度、色相，进行随即旋转、归一化等等。

# 学习率
lr = 0.001

# 随机梯度下降
optimizer_vgg = torch.optim.Adam([{'params': model_vgg_new.classifier[6].parameters()},
             {'params': model_vgg_new.classifier[9].parameters()}],lr = lr)

'''
第二步：训练模型
'''

def train_model(model,dataloader,size,epochs=1,optimizer=None):
    model.train()
    max_acc = 0
    for epoch in range(epochs):
        running_loss = 0.0
        running_corrects = 0
        count = 0
        for inputs,classes in dataloader:
            inputs = inputs.to(device)
            classes = classes.to(device)
            outputs = model(inputs)
            loss = criterion(outputs,classes)           
            optimizer = optimizer
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
            _,preds = torch.max(outputs.data,1)
            # statistics
            running_loss += loss.data.item()
            running_corrects += torch.sum(preds == classes.data)
            count += len(inputs)
            # print('Training: No. ', count, ' process ... total: ', size)
        epoch_loss = running_loss / size
        epoch_acc = running_corrects.data.item() / size
        if epoch_acc>max_acc:
          max_acc = epoch_acc
          torch.save(model, '/content/drive/MyDrive/model_best_new.pth')
        tqdm.write('nepoch: {} tLoss: {:.8f} Acc: {:.8f}'.format(epoch,epoch_loss, epoch_acc))

使用更加优秀的Adam优化梯度下降，在训练过程中记录下准确率最高的模型，保存下来。
分别跑30、100的epoch，发现30是效果最好的，达到97.85；而100次变成了97.7，可能出现了过拟合。

在这里插入图片描述

2. 在大训练集上训练

!wget https://static.leiphone.com/cat_dog.rar
!unrar x cat_dog.rar

用指令下载并解压数据集，这种方法所用的时间远远小于从本地拖入再解压

这里把添加的全连接层改为了Linear(4096, 1024)，训练10epoch，结果发现准确率不理想，又改了回去
在这里插入图片描述
使用改后的网络分别跑15、20、24epoch，最好的是20，达到了98%的准确率，但是训练24次准确率反而下降，就不再训练了。（测试次数用完，换了一个号~）

第四部分总结

我们通过在谷歌 Colab 上完成猫狗大战VGG模型的迁移学习，用比赛测试集进行测试并进行了优化。本次是通过训练好的VGG模型对其进行优化，对pytorch的使用更加熟悉，学习并使用了很多优化策略。对以后的学习和项目打下坚实的基础。

最后

以上就是开心太阳最近收集整理的关于第四次作业：猫狗大战挑战赛目录前言第一部分在谷歌 Colab 上完成猫狗大战VGG模型的迁移学习第二部分用比赛测试集进行测试并生成CSV文件提交第三部分进行优化第四部分总结的全部内容，更多相关第四次作业：猫狗大战挑战赛目录前言第一部分内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：深度学习
浏览次数：336 次浏览
发布日期：2024-09-20 22:55:02

第四次作业：猫狗大战挑战赛目录前言第一部分在谷歌 Colab 上完成猫狗大战VGG模型的迁移学习第二部分用比赛测试集进行测试并生成CSV文件提交第三部分进行优化第四部分总结

目录

前言

第一部分在谷歌 Colab 上完成猫狗大战VGG模型的迁移学习

1. 检查是否有GPU

2. 下载数据

3. 数据处理

4. 创建 VGG Model

5. 修改最后一层，冻结前面层的参数

6. 训练并测试全连接层

7. 可视化模型预测结果（主观分析）

第二部分用比赛测试集进行测试并生成CSV文件提交

第三部分进行优化

2. 在大训练集上训练

第四部分总结

最后

评论列表共有 0 条评论

发表评论取消回复

第四次作业：猫狗大战挑战赛目录前言第一部分 在谷歌 Colab 上完成猫狗大战VGG模型的迁移学习第二部分 用比赛测试集进行测试并生成CSV文件提交第三部分 进行优化第四部分 总结

目录

前言

第一部分 在谷歌 Colab 上完成猫狗大战VGG模型的迁移学习

1. 检查是否有GPU

2. 下载数据

3. 数据处理

4. 创建 VGG Model

5. 修改最后一层，冻结前面层的参数

6. 训练并测试全连接层

7. 可视化模型预测结果（主观分析）

第二部分 用比赛测试集进行测试并生成CSV文件提交

第三部分 进行优化

2. 在大训练集上训练

第四部分 总结

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

第四次作业：猫狗大战挑战赛目录前言第一部分在谷歌 Colab 上完成猫狗大战VGG模型的迁移学习第二部分用比赛测试集进行测试并生成CSV文件提交第三部分进行优化第四部分总结

第一部分在谷歌 Colab 上完成猫狗大战VGG模型的迁移学习

第二部分用比赛测试集进行测试并生成CSV文件提交

第三部分进行优化

第四部分总结

发表评论取消回复