4.3动态规划的 建模与求解
4.3.1建摸 1、理论依据--最优化原理 最优化原理: 个过程的最优策略具有这样的性质, 即无论初始状态及初始决策如何,对于 先前决策所形成的状态而言,其以后的 所有决策必构成最优策略
4.3.1 建摸 1、理论依据 -----最优化原理 最优化原理: 一个过程的最优策略具有这样的性质, 即无论初始状态及初始决策如何,对于 先前决策所形成的状态而言,其以后的 所有决策必构成最优策略
2、动态规划模型的几个要素: 阶段数k 2状态变量S 3)决策变量uk(Sk) 状态转移方程S1=T(s,u4) 4)指标函数Vkn 5)最优值函数f(S
2、动态规划模型的几个要素: 1)阶段数k 2)状态变量sk 3)决策变量uk ( sk ) 4)指标函数Vk,n 状态转移方程 ( ) k k uk s T s , +1 = 5)最优值函数fk (sk )
3、建立动态规划模型的基本要求: 1)所研究的问题必须能够分成几个相互联系的 阶段,而且在每一个阶段都具有需要进行决策的 问题 2)在每一阶段都必须有若干个与该阶段相关的状态 建模时总是从与决策有关的条件中,或是从问 题的约束条件中去选择状态变量。 般情况下,状态是所研究系统在该阶段可能处 于的情况或条件
3、建立动态规划模型的基本要求: 1)所研究的问题必须能够分成几个相互联系的 阶段,而且在每一个阶段都具有需要进行决策的 问题。 2)在每一阶段都必须有若干个与该阶段相关的状态 一般情况下,状态是所研究系统在该阶段可能处 于的情况或条件 建模时总是从与决策有关的条件中,或是从问 题的约束条件中去选择状态变量
状态的选取必须注意以下几个要点: (a)在所研究问题的各阶段,都能直接或间 接确定状态变量的取值 (b)能通过现阶段的决策,使当前状态转移 成下一阶段的状态 即能够给出状态转移方程Sk=T(s,u) (c)状态的无后效性 即以第阶段的状态为出发点的后部子过程的 最优策略应与s之前的过程无关 3)具有明确的指标函数,且阶段指标值可以计算 4)能正确列出最优值函数的递推公式和边界条件
3)具有明确的指标函数,且阶段指标值可以计算 4)能正确列出最优值函数的递推公式和边界条件 (b)能通过现阶段的决策,使当前状态转移 成下一阶段的状态 即 能够给出状态转移方程 ( ) k k uk s T s , +1 = (c)状态的无后效性 最优策略应与 之前的过程无关 即以第 阶段的状态 为出发点的后部子过程的 k k s k s 状态的选取必须注意以下几个要点: (a)在所研究问题的各阶段,都能直接或间 接确定状态变量的取值