跳转到内容

貝爾曼方程

维基百科,自由的百科全书

这是本页的一个历史版本,由Rm2slg留言 | 贡献2013年9月8日 (日) 00:52 (從英文頁面翻譯而來)编辑。这可能和当前版本存在着巨大的差异。

(差异) ←上一修订 | 最后版本 (差异) | 下一修订→ (差异)

「貝爾曼方程(Bellman Equation)」也被稱作「動態規劃方程(Dynamic Programming Equation)」,由理查貝爾曼(Richard Bellman)發現。貝爾曼方程是動態規劃(Dynamic Programming)這種數學最佳化方法能夠達到最佳化的必要條件。