基于迁移学习的ECG分类

本文来源于MATLAB例程:Classify Time Series Using Wavelet Analysis and Deep Learning
关键词:ECG 迁移学习 GoogLeNet
实验环境

  • 软件部分
本人使用的是MATLAB 2018b。官方文档提到GoogLeNet,AlexNet分别是在MATLAB 2017b、MATLAB 2017a版本引入的。
此实验必备的Toolbox:
1.Wavelet Toolbox
2.Image Processing Toolbox
3.Deep Learning Toolbox
4.Deep Learning Toolbox Model for GoogLeNet Network support package
5.Deep Learning Toolbox Model for AlexNet Network
其中,两个support package可能需要登录MATLAB账号才能下载,注册一个即可。
  • 硬件部分
这里我用的是显卡是NVIDIA Geforce RTX 2080。实验可以用CPU跑,但最好还是使用GPU,快的不是一丁半点。
数据集 96条心律失常(ARR)数据
30条充血性心力衰竭(CHF)数据
36条正常窦性心律(NSR)数据
共计162条数据,下载地址,请点击链接
读取数据 【基于迁移学习的ECG分类】代码如下:
dir = 'E:\Transfer_learning\ECG\ECG_Matlab\ECGdata'; load(fullfile(dir,'ECGData.mat')); parentDir = dir; dataDir = 'data'; helperCreateECGDirectories(ECGData,parentDir,dataDir)

读入数据后,工作空间生成了名为ECGdata的结构数组,如下图。Data为162?65536维,即162条数据,每条数据时长为512s,采样率为128Hz。Labels存储了每条数据的标签。
基于迁移学习的ECG分类
文章图片
ECGdata 显示原始数据 借助helperPlotReps()函数,绘制原始数据,如图。
基于迁移学习的ECG分类
文章图片
原始数据示例图 特征提取 这里主要使用cwtfilterbank函数,将原始的一维心电信号通过连续小波变换(CWT)转换为时频域表达,即scalograms。代码和示例图如下:
%时频域表达,CWT连续小波变换Fs = 128; fb = cwtfilterbank('SignalLength',1000,...'SamplingFrequency',Fs,...'VoicesPerOctave',12); sig = ECGData.Data(1,1:1000); [cfs,frq] = wt(fb,sig); t = (0:999)/Fs; figure; pcolor(t,frq,abs(cfs))set(gca,'yscale','log'); shading interp; axis tight; title('Scalogram'); xlabel('Time (s)'); ylabel('Frequency (Hz)')%生成各个病种的RGB图像,尺寸为224?224?3helperCreateRGBfromTF(ECGData,parentDir,dataDir)

基于迁移学习的ECG分类
文章图片
ECG的时频域表达 数据集的划分
%划分训练与测试数据集allImages = imageDatastore(fullfile(parentDir,dataDir),...'IncludeSubfolders',true,...'LabelSource','foldernames'); % 80%作为训练,其余作为测试,随机种子设为默认,以便可重复。rng default[imgsTrain,imgsValidation] = splitEachLabel(allImages,0.8,'randomized'); disp(['Number of training images: ',num2str(numel(imgsTrain.Files))]); disp(['Number of validation images: ',num2str(numel(imgsValidation.Files))]);

加载GoogLeNet并进行训练 GooLeNet
net = googlenet; lgraph = layerGraph(net); numberOfLayers = numel(lgraph.Layers); figure('Units','normalized','Position',[0.1 0.1 0.8 0.8]); plot(lgraph)%绘制结构图title(['GoogLeNet Layer Graph: ',num2str(numberOfLayers),' Layers']);

基于迁移学习的ECG分类
文章图片
GoogLeNet的网络结构图 GoogLeNet模型的参数修改 GoogleNet是使用ImageNet训练的对于1000分类的深层CNN网络,这里最后四层修改为针对三分类问题的输出。
lgraph = removeLayers(lgraph,{'pool5-drop_7x7_s1','loss3-classifier','prob','output'}); numClasses = numel(categories(imgsTrain.Labels)); newLayers = [dropoutLayer(0.6,'Name','newDropout')%dropout概率60%fullyConnectedLayer(numClasses,'Name','fc','WeightLearnRateFactor',5,'BiasLearnRateFactor',5)%全连接层,这里numClasses为3softmaxLayer('Name','softmax')classificationLayer('Name','classoutput')]; lgraph = addLayers(lgraph,newLayers); lgraph = connectLayers(lgraph,'pool5-7x7_s1','newDropout'); inputSize = net.Layers(1).InputSize;

模型超参数设置及训练 参数设置和训练结果如下,最终的正确率为90.625%。ps.例程中做的训练过程动态图真的太赞了!
options = trainingOptions('sgdm',...'MiniBatchSize',15,...'MaxEpochs',20,...'InitialLearnRate',1e-4,...'ValidationData',imgsValidation,...'ValidationFrequency',10,...'ValidationPatience',Inf,...'Verbose',1,...'ExecutionEnvironment','gpu',...'Plots','training-progress');

基于迁移学习的ECG分类
文章图片
训练过程 例程中后面的内容不再赘述,主要是探讨网络内部的结构。和下图所示的人脸识别的很相似。
基于迁移学习的ECG分类
文章图片
人脸识别算法中不同网络层提取的特征
  • 底层网络:各种边缘结构
  • 中层网络:眼睛,鼻子,嘴巴等局部特征
  • 高层网络:将局部特征组合,得到各种人脸特征
后记 本文实验是将ECG转换为二维的时频域图作为网络输入,在arXiv上浏览文献发现有一篇文章做的工作很相似,贴在这里,是基于DenseNet做的迁移。
ECG Arrhythmia Classification Using Transfer Learning from 2-Dimensional Deep CNN Features

    推荐阅读