news 2026/6/10 14:02:33

深度学习:5层CNN实现图片分类(MATLAB版)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
深度学习:5层CNN实现图片分类(MATLAB版)

深度学习 5层CNN代码实现图片分类 训练集共有9个文件夹代表9类,每类有50张图片,可根据需要自行准备训练集 MATLAB代码,代码注释清楚,容易上手 温馨提示:联系请考虑是否需要,(Example_7)

在深度学习领域,卷积神经网络(CNN)是图片分类任务中极为常用且强大的模型。今天咱就用MATLAB来实现一个5层CNN做图片分类,数据集有9个类别,每个类别50张图片。

准备训练集

首先,我们得准备好数据。假设这9个文件夹都在一个名为data的主文件夹下。

dataDir = 'data'; imageDir = imageDatastore(dataDir, 'IncludeSubfolders', true, 'LabelSource', 'foldernames');

这段代码使用imageDatastore函数创建了一个图像数据存储对象imageDirIncludeSubfolders设置为true意味着它会递归搜索子文件夹,LabelSource设置为foldernames则表示文件夹名就是图片的类别标签。

构建5层CNN网络

下面开始搭建5层的CNN网络结构。

layers = [ imageInputLayer([224 224 3]) convolution2dLayer(3,16,'Padding','same') batchNormalizationLayer reluLayer maxPooling2dLayer(2,'Stride',2) convolution2dLayer(3,32,'Padding','same') batchNormalizationLayer reluLayer maxPooling2dLayer(2,'Stride',2) convolution2dLayer(3,64,'Padding','same') batchNormalizationLayer reluLayer maxPooling2dLayer(2,'Stride',2) convolution2dLayer(3,128,'Padding','same') batchNormalizationLayer reluLayer maxPooling2dLayer(2,'Stride',2) fullyConnectedLayer(9) softmaxLayer classificationLayer];

imageInputLayer([224 224 3])指定了输入图像的大小为224x224像素,且是RGB三通道图像。

convolution2dLayer(3,16,'Padding','same')表示一个卷积层,卷积核大小为3x3,输出16个特征图,Padding设置为same保证卷积后的特征图大小与输入相同。

batchNormalizationLayer用于批量归一化,加速网络收敛。reluLayer是激活函数层,采用ReLU函数引入非线性。

深度学习 5层CNN代码实现图片分类 训练集共有9个文件夹代表9类,每类有50张图片,可根据需要自行准备训练集 MATLAB代码,代码注释清楚,容易上手 温馨提示:联系请考虑是否需要,(Example_7)

maxPooling2dLayer(2,'Stride',2)进行最大池化操作,池化核大小为2x2,步长为2,起到降采样的作用。

fullyConnectedLayer(9)是全连接层,因为我们有9个类别,所以输出维度为9。softmaxLayer将全连接层的输出转换为概率分布,classificationLayer定义了分类任务的损失函数。

训练模型

接下来训练我们构建好的网络。

options = trainingOptions('adam',... 'InitialLearnRate',0.001,... 'MaxEpochs',50,... 'MiniBatchSize',32,... 'Shuffle','every-epoch',... 'ValidationData',imageDir,... 'ValidationFrequency',3,... 'Verbose',false,... 'Plots','training-progress'); net = trainNetwork(imageDir,layers,options);

trainingOptions设置了训练的各项参数。这里使用adam优化器,初始学习率为0.001,最大训练轮数为50,每批训练样本数为32。Shuffle设置为every-epoch,表示每轮训练前打乱数据顺序。ValidationData指定验证集,ValidationFrequency表示每3轮进行一次验证。Verbose设为false关闭详细输出,Plots设为training - progress会绘制训练进度图。

最后通过trainNetwork函数使用训练集数据imageDir和定义好的网络层layers,按照设置的训练选项options来训练网络,得到训练好的模型net

通过以上步骤,我们就用MATLAB实现了一个5层CNN的图片分类模型。希望这篇博文能帮助你快速上手深度学习中的图片分类任务。如果在实践过程中有任何问题,欢迎一起探讨。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 12:32:28

so文件是什么

so文件是什么? 在Linux系统中,.so 文件 是最常见的动态链接库(Dynamic Shared Library),全称是 Shared Object(共享对象)。 简单来说,它就相当于 Windows 系统里的 .dll 文件。 一…

作者头像 李华
网站建设 2026/5/23 19:00:49

长达10小时续航!云卓G16遥控器如何解决户外作业电量焦虑?

续航能力是衡量地面端设备可靠性的关键指标。云卓科技G16遥控器内置高能量密度锂离子电池,满电状态下可支持连续工作9至10小时,足以应对绝大多数野外作业日的工作需求。云卓科技在产品设计中贯穿了“荒野求生思维”,这意味着G16遥控器的一切都…

作者头像 李华
网站建设 2026/6/9 4:03:13

【Linux命令大全】010.设备管理之MAKEDEV命令(实操篇)

【Linux命令大全】010.设备管理之MAKEDEV命令(实操篇) ✨ 本文为Linux设备管理命令的全面汇总与深度优化,结合图标、结构化排版与实用技巧,专为高级用户和系统管理员打造。 (关注不迷路哈!!!) 文…

作者头像 李华
网站建设 2026/6/10 13:22:36

leetcode 915. Partition Array into Disjoint Intervals 分割数组

Problem: 915. Partition Array into Disjoint Intervals 分割数组 分别求出左侧最大值&#xff0c;右侧最小值&#xff0c;然后从左到右两者比较&#xff0c;满足题意的索引就是答案 Code class Solution { public:int partitionDisjoint(vector<int>& nums) {int…

作者头像 李华