Elman 神经网络 MATLAB 函数详解
一、引言
Elman 神经网络是一种在时间序列分析和动态系统建模领域广泛应用的递归神经网络(RNN)。MATLAB 提供了一系列强大的函数来创建、训练和应用 Elman 神经网络,使得用户能够方便地利用其处理具有时间序列特性的数据。本文将详细介绍 MATLAB 中与 Elman 神经网络相关的函数,包括它们的语法、参数含义、使用示例以及在不同应用场景中的应用。
二、MATLAB 中 Elman 神经网络相关函数
(一)创建 Elman 神经网络对象:newelm 函数
- 函数语法
net = newelm(P,T,S,TF,BTF,BLF,PF)
- 参数详解
- P(输入向量范围矩阵):它是一个
Rx2
的矩阵,R
表示输入向量的维数。每一行指定了对应输入元素的最小值和最大值范围。例如,如果输入是二维向量,第一个维度范围是[0, 10]
,第二个维度范围是[ - 5, 5]
,则P
为[0 10; - 5 5]
。以下是生成输入向量范围矩阵的示例代码:
- P(输入向量范围矩阵):它是一个
% 假设输入数据有 3 个维度,这里随机生成范围
input_dim = 3;
min_values = rand(1, input_dim) - 0.5;
max_values = rand(1, input_dim) + 0.5;
P = [min_values; max_values]';
- **T(目标输出向量范围矩阵)**:与 `P` 类似,`T` 是一个 `Sx2` 的矩阵,用于指定目标输出向量的范围,`S` 是目标输出向量的维数。如果目标输出是一维的,范围是 `[ - 1, 1]`,则 `T` 为 `[ - 1 1]`。- **S(隐含层神经元数量)**:指定 Elman 神经网络隐含层中神经元的个数。例如,设置 `S = 10` 表示隐含层有 10 个神经元。隐含层神经元数量的选择通常需要根据具体问题和数据特点进行调整,一般通过实验来确定合适的值。- **TF(神经元传递函数)**:可以是一个字符串数组,用于指定网络中神经元的激活函数类型。对于隐含层和输出层,可以选择不同的激活函数。常见的激活函数包括 `'logsig'`(对数 Sigmoid 函数)、`'tansig'`(双曲正切 Sigmoid 函数)、`'purelin'`(线性函数)等。例如,设置隐含层激活函数为双曲正切 Sigmoid 函数,输出层为线性函数,可以使用 `TF = {'tansig', 'purelin'}`。- **BTF(训练函数)**:指定网络的训练算法,如 `'trainlm'`(Levenberg - Marquardt 算法)、`'traingdx'`(带动量的梯度下降算法)等。不同的训练函数有不同的特点,`'trainlm'` 通常收敛速度快,但需要更多的内存;`'traingdx'` 相对更稳定。例如,使用 `'trainlm'` 训练函数,设置 `BTF = 'trainlm'`。- **BLF(性能函数)**:用于评估网络性能的函数,一般使用均方误差函数 `'mse'`(mean - squared error),即 `BLF ='mse'`。- **PF(参数显示函数)**:用于在训练过程中显示网络参数的信息,如 `'plotperform'`(显示训练性能)、`'plottrainstate'`(显示训练状态)等。例如,设置 `PF = 'plotperform'`,在训练过程中可以直观地看到训练误差的变化情况。
- 代码示例
以下是创建一个简单 Elman 神经网络的代码:
% 定义输入向量范围,假设输入是二维数据,范围在[0,1]区间
P = [0 1; 0 1]';
% 目标输出范围,假设是一维数据,范围在[-1,1]
T = [-1 1];
% 隐含层神经元数量
S = 5;
% 激活函数,隐含层用'tansig',输出层用'purelin'
TF = {'tansig', 'purelin'};
% 训练函数
BTF = 'trainlm';
% 性能函数
BLF ='mse';
% 参数显示函数
PF = 'plotperform';net = newelm(P, T, S, TF, BTF, BLF, PF);
(二)训练 Elman 神经网络:train 函数
- 函数语法
[net,tr] = train(net,X,T)
- 参数详解
- net(已创建的 Elman 神经网络对象):由
newelm
函数创建的网络对象,包含了网络的结构、初始参数等信息。 - X(输入训练数据矩阵):它是一个
QxR
的矩阵,其中Q
表示训练样本的数量,R
表示输入向量的维数。即每个训练样本按行排列在矩阵中。例如,如果有 100 个二维训练样本,X
的大小为100x2
。以下是生成模拟训练数据的示例代码:
- net(已创建的 Elman 神经网络对象):由
% 生成 100 个二维训练样本
num_samples = 100;
input_dim = 2;
X = rand(num_samples, input_dim);
- **T(目标输出训练数据矩阵)**:它是一个 `QxS` 的矩阵,`Q` 是训练样本数量,`S` 是目标输出向量的维数。每个训练样本对应的目标输出按行排列。例如,如果目标输出是一维的,对于 100 个训练样本,`T` 的大小为 `100x1`。如果目标输出是与输入样本相关的某个计算结果,可以根据具体情况生成。例如,假设目标输出是输入样本两个维度之和,可以使用以下代码生成:
T = sum(X, 2).reshape(-1, 1);
- **返回值**:`net` 返回训练后的网络对象,其参数(如权重等)已经根据训练数据进行了调整;`tr` 是一个结构体,包含了训练过程的相关信息,如训练步数、性能指标等,可以用于后续分析训练效果。
- 代码示例
以下是使用前面创建的网络进行训练的代码,假设已经有合适的训练数据X_train
和T_train
:
[net, tr] = train(net, X_train, T_train);
(三)模拟 Elman 神经网络的输出:sim 函数
-
函数语法
Y = sim(net,X)
-
参数详解
- net(训练好的 Elman 神经网络对象):经过
train
函数训练后的网络,具备了对输入数据进行处理和输出预测的能力。 - X(输入测试数据矩阵):格式与训练数据矩阵
X
类似,是一个MxR
的矩阵,其中M
是测试样本的数量,R
是输入向量的维数。例如,如果有 50 个二维测试样本,X
的大小为50x2
。 - Y(输出预测数据矩阵):它是一个
MxS
的矩阵,M
是测试样本数量,S
是目标输出向量的维数,即网络对每个测试样本的输出预测结果。
- net(训练好的 Elman 神经网络对象):经过
-
代码示例
以下是使用训练好的网络对新的测试数据进行预测的代码:
% 假设已经有测试数据 X_test
Y_pred = sim(net, X_test);
三、Elman 神经网络在 MATLAB 中的应用示例
(一)时间序列预测示例
- 数据准备
假设我们要预测一个简单的正弦波时间序列数据。首先生成训练数据和测试数据:
% 生成时间序列数据点
t = 0:0.1:20;
sin_wave = sin(t);% 构建训练数据,以过去 5 个时间点预测下一个时间点的值
input_data = [];
target_data = [];
for i = 5:length(t)input_data = [input_data; sin_wave(i - 4:i)'];target_data = [target_data; sin_wave(i)];
end% 划分训练集和测试集
train_ratio = 0.8;
train_size = floor(train_ratio * length(input_data));
X_train = input_data(1:train_size, :);
T_train = target_data(1:train_size, :)';
X_test = input_data(train_size + 1:end, :);
T_test = target_data(train_size + 1:end, :)';
- 网络创建、训练与预测
% 创建 Elman 神经网络
P = [min(X_train(:)) max(X_train(:)); min(X_train(:)) max(X_train(:)); min(X_train(:)) max(X_train(:)); min(X_train(:)) max(X_train(:)); min(X_train(:)) max(X_train(:))]';
T = [min(T_train(:)) max(T_train(:))];
S = 10;
TF = {'tansig', 'purelin'};
BTF = 'trainlm';
BLF ='mse';
PF = 'plotperform';
net = newelm(P, T, S, TF, BTF, BLF, PF);% 训练网络
[net, tr] = train(net, X_train, T_train);% 预测
Y_pred = sim(net, X_test);
- 性能评估
可以使用以下代码评估预测结果的准确性,例如计算均方误差:
mse_value = mean((Y_pred - T_test').^2);
disp(['均方误差: ', num2str(mse_value)]);
(二)系统建模示例(以简单的非线性动态系统为例)
- 系统定义与数据生成
考虑一个简单的非线性动态系统:y(k + 1)=0.8*y(k)+0.2*y(k - 1)+u(k)+0.3*u(k - 1)
,其中u(k)
是输入,y(k)
是输出。生成训练数据和测试数据:
% 生成输入序列
u = rand(200, 1);
% 初始化输出序列
y = zeros(200, 1);
for k = 2:200y(k) = 0.8*y(k - 1) + 0.2*y(k - 2) + u(k) + 0.3*u(k - 1);
end% 构建训练数据,以当前和前一个输入、输出预测下一个输出
input_data = [y(1:199) y(2:200) u(1:199) u(2:200)];
target_data = y(2:200);% 划分训练集和测试集
train_ratio = 0.8;
train_size = floor(train_ratio * length(input_data));
X_train = input_data(1:train_size, :);
T_train = target_data(1:train_size, :)';
X_test = input_data(train_size + 1:end, :);
T_test = target_data(train_size + 1:end, :)';
- 网络创建、训练与预测
% 创建 Elman 神经网络
P = [min(X_train(:)) max(X_train(:)); min(X_train(:)) max(X_train(:)); min(X_train(:)) max(X_train(:)); min(X_train(:)) max(X_train(:))]';
T = [min(T_train(:)) max(T_train(:))];
S = 15;
TF = {'tansig', 'purelin'};
BTF = 'trainlm';
BLF ='mse';
PF = 'plotperform';
net = newelm(P, T, S, TF, BTF, BLF, PF);% 训练网络
[net, tr] = train(net, X_train, T_train);% 预测
Y_pred = sim(net, X_test);
- 性能评估
同样计算均方误差来评估模型对非线性动态系统的建模能力:
mse_value = mean((Y_pred - T_test').^2);
disp(['均方误差: ', num2str(mse_value)]);
四、总结
MATLAB 中的 Elman 神经网络函数为用户提供了一个方便、高效的平台来处理时间序列和动态系统相关的问题。通过 newelm
函数创建网络结构,train
函数训练网络以调整参数,sim
函数进行预测输出,再结合合适的数据准备和性能评估方法,可以有效地应用 Elman 神经网络解决实际问题。在使用过程中,需要根据具体问题的特点合理选择网络参数,如隐含层神经元数量、激活函数、训练函数等,以获得最佳的性能。同时,通过分析训练过程中的信息和预测结果的评估,可以进一步优化网络模型,提高预测或建模的准确性。