数学建模：现代优化算法之模拟退火数学建模：现代优化算法之模拟退火前言Simulated annealing algorithm（SAA算法）参考总结

233 阅读 0 评论 154 点赞

我是靠谱客的博主活泼金毛，这篇文章主要介绍数学建模：现代优化算法之模拟退火数学建模：现代优化算法之模拟退火前言Simulated annealing algorithm（SAA算法）参考总结，现在分享给大家，希望可以做个参考。

数学建模：现代优化算法之模拟退火

开始了开始了！！！

数学建模

数学建模：现代优化算法之模拟退火
前言
Simulated annealing algorithm（SAA算法）
- 1.算法简介
- - 数学基础
  - 算法思路整理
  - 补充：Metropolis算法
- 2.应用举例
参考
总结

肝！

前言

现代优化算法是上世纪80年代初兴起的启发式算法。这些算法包括禁忌搜索（tabu search），模拟退火（simulated annealing），遗传算法（genetic algorithms），人工神经网络（neural networks）。它们主要用于解决大量的实际应用问题。
目前，这些算法在理论和实际应用方面得到了较大的发展。无论这些算法是怎样产生的，它们有一个共同的目标——求NP-hard组合优化问题的全局最优解。虽然有这些目标，但NP-hard理论限制它们只能以启发式的算法去求解实际问题。
启发式算法包含的算法很多，例如解决复杂优化问题的蚁群算法（Ant Colony Algorithms）。有些启发式算法是根据实际问题而产生的，如解空间分解、解空间的限制等；另一类算法是集成算法，这些算法是诸多启发式算法的合成。

Simulated annealing algorithm（SAA算法）

1.算法简介

模拟退火算法得益于材料统计力学的研究成果。统计力学表明材料中粒子的不同结构对应于粒子的不同能量水平。在高温条件下，粒子的能量较高，可以自由运动和重新排列。在低温条件下，粒子能量较低。如果从高温开始，非常缓慢地降温（这个过程被称为退火），粒子就可以在每个温度下达到热平衡。当系统完全被冷却时，最终形成处于低能状态的晶体。

数学基础

如果用粒子的能量定义材料的状态，Metropolis算法用一个简单的数学模型描述了退火过程。假设材料在状态 $i$ 之下的能量为 $E (i)$ ，那么材料在温度 $T$ 时从状态 $i$ 进入状态 $j$ 就遵循如下规律：
（1）如果 $E (j) \leq E (i)$ ，接受该状态被转换。
（2）如果 $E (j) > E (i)$ ，则状态转换以如下概率被接受
$e^frac{E(i)-E(j)}{KT}，$
其中 $K$ 是物理学中的波尔兹曼常数， $T$ 是材料温度。

在某一个特定温度下，进行了充分的转换之后，材料将达到热平衡。这时材料处于状态 $i$ 的概率满足波尔兹曼分布
$P_T(X=i)=frac{e^{-frac{E(i)}{KT}}}{sum_{jin S} e^{-frac{E(j)}{KT}}}，$
其中 $X$ 表示材料当前状态的随机变量， $S$ 表示状态空间集合。

显然
$lim_{Trightarrowinfty}{frac{e^{-frac{E(i)}{KT}}}{sum_{jin S} e^{-frac{E(j)}{KT}}}}=frac{1}{|S|}，$
式中： $∣ S ∣$ 表示集合S中状态的数量。这表明所有状态在高温下具有相同的概率。

而当温度下降时，有
$lim_{Trightarrow0}frac{e^{-frac{Eleft(iright)-E_{{min}}}{KT}}}{sum_{jin S}^{sum}e^{-frac{Eleft(jright)-E_{{min}}}{KT}}=lim_{Trightarrow0}frac{e^{-frac{Eleft(iright)-E_{{min}}}{KT}}}{sum_{jin S_{{min}}}^{sum+sum_{jnotin S_{{min}}}^{sum}e^{-frac{Eleft(jright)-E_{{min}}}{KT}}}e^{-frac{Eleft(jright)-E_{{min}}}{KT}}}}$
式中： ${Emin_{jin S}}_{min}{E(j)}$ 且 ${S{min}}_{{min}}$ 。

算法思路整理

在这里插入图片描述
算法流程

设定当前解（即为当前的最优解）
产生新解与当前解差值
判断新解是否被接受
当新解被确定接受时，新解被作为当前解
循环以上四个步骤
最后找到全局最优解

参数讲解
退火过程由一组初始参数，即冷却进度表控制。它的目的是尽量使系统达到平衡，以使算法在有限的时间内逼近最优解。

冷却进度表包括：

控制温度参数的初值 $T_0$
控制温度 $T$ 的衰减参数（温度的更新）
马尔科夫链的长度 $L_k$ （迭代次数）
控制参数 $T$ 的终值（停止准则）

相似性比较

组合优化问题	金属物体
解	粒子状态
最优解	能量最低的状态
设定初温	熔解过程
Methopolis	等温过程
控制参数的下降	冷却
目标函数	能量

优点
· 高效地求解NP完全问题（如TSP问题，0-1背包问题等）
· 相较于其他非线性与优化算法，模拟退火算法编程工作量小且易于实现

缺点
· 使用不当，可能会陷入局部最优
· 参数难以控制，所得结果可能为接近最优解但并非最优解

算法对比
在这里插入图片描述

注意事项

（1）理论上，降温过程要足够缓慢，要使得在每一温度下达到热平衡。但在计算机实现中，如果降温速度过缓，所得到的解的性能会较为令人满意，但是算法会太慢，相对于简单的搜索算法不具有明显优势。如果降温速度过快，很可能最终得不到全局最优解。因此使用时要综合考虑解的性能和算法速度，在两者之间采取一种折衷。
（2）要确定在每一温度下状态转换的结束准则。实际操作可以考虑当连续 $m$ 次的转换过程没有使状态发生变化时结束该温度下的状态转换。最终温度的确定可以提前定为一个较小的值 $T_e$ ，或连续几个温度下转换过程没有使状态发生变化算法就结束。
（3）选择初始温度和确定某个可行解的邻域的方法也要恰当。

补充：Metropolis算法

Metropolis 算法是马尔可夫链蒙特卡洛【Markov Chain Monte Carlo, MCMC】的一种特殊算法。

Metropolis采样算法为CSDN博主「jingjishisi」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/jingjishisi/article/details/79291258

2.应用举例

【例一】 已知100个目标的经度、纬度如表12.1所示。
在这里插入图片描述
我方有一个基地，经度和纬度为 $（ 70, 40 ）$ 。假设我方飞机的速度为 $1000$ 公里/小时。我方派一架飞机从基地出发，侦察完所有目标，再返回原来的基地。在每一目标点的侦察时间不计，求该架飞机所花费的时间（假设我方飞机巡航时间可以充分长）。

这是一个旅行商问题。给我方基地编号为 $1$ ，目标依次编号为 $2 ， 3 ， \dots ， 101$ ，最后我方基地再重复编号为 $102$ （这样便于程序中计算）。距离矩阵 $D=(d_{ij})_{102times102}$ ，其中 $d_{ij}$ 表示表示 $i, j$ 两点的距离， $i, j = 1, 2, \dots, 102$ ，这里 $D$ 为实对称矩阵。则问题是求一个从点 $1$ 出发，走遍所有中间点，到达点 $102$ 的一个最短路径。

上面问题中给定的是地理坐标（经度和纬度），必须求两点间的实际距离。设 $A, B$ 两点的地理坐标分别为 $x_1,y_1)，(x_2,y_2)$ ，过 $A, B$ 两点的大圆的劣弧长即为两点的实际距离。以地心为坐标原点 $O$ ，以赤道平面为 $X O Y$ 平面，以0度经线圈所在的平面为 $X O Z$ 平面建立三维直角坐标系。则 $A, B$ 两点的直角坐标分别为
$A(Rcos{x_1}cos{y_1},Rsin{x_1}cos{y_1},Rsin{y_1})，$
$B(Rcos{x_2}cos{y_2},Rsin{x_2}cos{y_2},Rsin{y_2})，$
式中： $R = 6370 k m$ 为地球半径。

$A, B$ 两点的实际距离
$d = R a r c c o s ( O A ⃗ ⋅ O B ⃗ ∣ O A ⃗ ∣ ⋅ ∣ O B ⃗ ∣ ) ， d=R{arccos}{left(frac{vec{mathrm{OA}}cdotvec{OB}}{left|vec{mathrm{OA}}right|cdotleft|vec{OB}right|}right)}，$

化简得
$d=Rarccos{[}{cos}{(}x_1-x_2){cos}{y_1}{cos}{y_2}+{sin}{y_1}{sin}{y_2}].$

推导过程如下：
在这里插入图片描述

求解的模拟退火算法描述如下：

（1）解空间

解空间 $S$ 可表为 $1, 2, \dots, 101, 102$ 的所有固定起点和终点的循环排列集合，即
$S=lbrace{(pi_1,cdots,pi_{102})|pi_1=1,(pi_2,cdots,pi_{101})为{2,3,⋯,101}的循环排列,pi_{102}=102}rbrace ，$
其中每一个循环排列表示侦察 $100$ 个目标的一个回路， $pi_i=j$ 表示在第 $i - 1$ 次侦察目标 $j$ ，初始解可选为 $(1, 2, \dots, 102)$ ，本文中我们先使用Monte Carlo（蒙特卡洛）方法求得一个较好的初始解。

回顾蒙特卡洛方法：
线性规划问题中有所提及：
蒙特卡洛方法又称统计模拟法、随机抽样技术，是一种随机模拟方法，以概率和统计理论方法为基础的一种计算方法，是使用随机数（或更常见的伪随机数）来解决很多计算问题的方法。将所求解的问题同一定的概率模型相联系，用电子计算机实现统计模拟或抽样，以获得问题的近似解。

（2）目标函数

目标函数（或称代价函数）为侦察所有目标的路径长度。要求
$min{f}(pi_1,pi_2,cdots,pi_{102})=sum_{i=1}^{101}d_{pi_ipi_{i+1}}，$
而一次迭代由下列三步构成

（3）新解的产生

设上一步迭代的解为
$pi_1cdotspi_{u-1}pi_upi_{u+1}cdotspi_{v-1}pi_vpi_{v+1}cdotspi_{w-1}pi_wpi_{w+1}cdotspi_{102}。$

i） 2变换法

任选序号 $u, v$ ，交换 $u$ 与 $v$ 之间的顺序，变成逆序，此时的新路径为
$pi_1cdotspi_{u-1}pi_vpi_{v-1}cdotspi_{u+1}pi_upi_{v+1}cdotspi_{102}.$

ii） 3变换法

任选序号 $u, v$ 和 $w$ ，将 $u$ 和 $v$ 之间的路径插到 $w$ 之后，对应的新路径为
$pi_1cdotspi_{u-1}pi_{v+1}cdotspi_wpi_ucdotspi_vpi_{w+1}cdotspi_{102}$

（4）代价函数差

对于2变换法，路径差可表示为
$f=(d_{pi_{u-1}pi_v}+d_{pi_upi_{v+1}})-(d_{pi_{u-1}pi_u}+d_{pi_vpi_{v+1}})$

（5）接受准则

$1,&Δf<0,\ exp(-Δf/T),&Δf≥0.\ end{cases}$

如果 $Δ f < 0$ ，则接受新的路径。否则，以概率 $e x p (- Δ f / T)$ 接受新的路径，即用计算机产生一个[0,1]区间上均匀分布的随机数rand，若 $r a n d \leq e x p (- Δ f / T)$ 则接受。

（6）降温

利用选定的降温系数 $α$ 进行降温，取新的温度 $T$ 为 $α T$ （这里 $T$ 为上一步迭代的温度），这里选定 $α = 0.999$ 。

（7）结束条件

用选定的终止温度 $e=10^{-30}$ ，判断退火过程是否结束。若 $T < e$ ，算法结束，输出当前状态。

编写MATLAB程序如下：

clc, clear, close all

%% 数据预处理
sj0=load('C:UsersAdministratorDesktop“高教杯”国赛备赛数学建模算法与应用（第3版）源程序程序及数据12第12章  现代优化算法data12_1.txt');
x=sj0(:,[1:2:8]); x=x(:); %取奇数列（经度列） 
y=sj0(:,[2:2:8]); y=y(:); %取偶数列（维度列）
sj=[x y] %【经度，维度】
d1=[70,40]; %基地位置，经度和纬度为（70,40）
xy=[d1;sj;d1]; %将基地位置加在首尾


%% 目标函数
sj=xy*pi/180; %角度化成弧度
d=zeros(102); %距离矩阵d初始化
%计算弧长
for i=1:101
   for j=i+1:102
       d(i,j)=6370*acos(cos(sj(i,1)-sj(j,1))*cos(sj(i,2))*...
           cos(sj(j,2))+sin(sj(i,2))*sin(sj(j,2)));
   end
end
d=d+d';


%% 初始解
path=[];long=inf; %巡航路径及长度初始化   设置long为无穷大
for j=1:1000  %求较好的初始解
    path0=[1 1+randperm(100),102]; temp=0; % p = randperm(n)生成一个从 1 到 n 的整数的随机排列
    for i=1:101
        temp=temp+d(path0(i),path0(i+1));
    end
    if temp<long
        path=path0; long=temp;
    end
end

%% 导入参数
e=0.1^30; % 控制温度参数的终值
L=20000; % 马尔科夫链的长度
at=0.999; % 控制温度的损减参数
T=1; % 控制温度参数的初值

%% 退火过程
for k=1:L
    
     % 新解的产生
    c=2+floor(100*rand(1,2));  % floor():朝负无穷大四舍五入,相当于"下取整"
    c=sort(c); c1=c(1);c2=c(2); % c1最小，c2次小
    
    %计算代价函数值的增量
    df=d(path(c1-1),path(c2))+d(path(c1),path(c2+1))-...
        d(path(c1-1),path(c1))-d(path(c2),path(c2+1));
    
    %接受准则
    if df<0 %接受，则状态转换
        path=[path(1:c1-1),path(c2:-1:c1),path(c2+1:102)]; long=long+df;
    elseif exp(-df/T)>=rand %否则则以一定的概率接受
        path=[path(1:c1-1),path(c2:-1:c1),path(c2+1:102)]; long=long+df;
    end
    %降温
    T=T*at;
    if T<e
        break;
    end
end

%% 输出结果
path, long % 输出巡航路径及路径长度
xx=xy(path,1); yy=xy(path,2);

%% 可视化

plot(xx,yy,'-*') %画出巡航路径