跳至內容

貝爾曼方程

維基百科,自由的百科全書

這是本頁的一個歷史版本,由Rm2slg對話 | 貢獻2013年9月8日 (日) 00:52 (從英文頁面翻譯而來)編輯。這可能和目前版本存在着巨大的差異。

(差異) ←上一修訂 | 最新修訂 (差異) | 下一修訂→ (差異)

「貝爾曼方程(Bellman Equation)」也被稱作「動態規劃方程(Dynamic Programming Equation)」,由理查貝爾曼(Richard Bellman)發現。貝爾曼方程是動態規劃(Dynamic Programming)這種數學最佳化方法能夠達到最佳化的必要條件。