跳转到内容

贝尔曼方程

维基百科,自由的百科全书

这是本页的一个历史版本,由Rm2slg留言 | 贡献2013年9月8日 (日) 00:52 (從英文頁面翻譯而來)编辑。这可能和当前版本存在着巨大的差异。

(差异) ←上一修订 | 最后版本 (差异) | 下一修订→ (差异)

“贝尔曼方程(Bellman Equation)”也被称作“动态规划方程(Dynamic Programming Equation)”,由理查贝尔曼(Richard Bellman)发现。贝尔曼方程是动态规划(Dynamic Programming)这种数学最佳化方法能够达到最佳化的必要条件。