五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網 會員登陸 & 注冊

北大公開課-人工智能基礎 49 決策理論規(guī)劃

2023-04-02 22:58 作者:朝朝暮暮1895  | 我要投稿


決策規(guī)劃,從初始狀態(tài),經過一系列動作,達到目標狀態(tài)

決策理論規(guī)劃,用最小代價,從初始狀態(tài),到達目標狀態(tài)

最小代價,相當于最大期望效應 MEU (一系列效用函數值最大化的節(jié)點集合)

馬爾可夫模型

離散時間,隨機控制,但是最終動作的結果,僅僅取決于當前狀態(tài)(定向擴散)

經典規(guī)劃的核心要素

環(huán)境確定,狀態(tài)完全可知,求解是找到一個從初始狀態(tài)出發(fā)到達目標狀態(tài)的解


馬爾可夫決策

智能體處于的環(huán)境是隨機的,時間是離散的;求解的目的是找到一個控制其(擴散)的過程

馬爾可夫決策的核心問題不在于找到策略和解,核心問題在于找到效用函數

效用值迭代等式

策略迭代

U效用相當于每一個步驟的相對最大值MEU的集合。




北大公開課-人工智能基礎 49 決策理論規(guī)劃的評論 (共 條)

分享到微博請遵守國家法律
龙江县| 万载县| 张家港市| 昌图县| 铜川市| 郁南县| 枣庄市| 深泽县| 眉山市| 牡丹江市| 汉源县| 海南省| 深圳市| 巨野县| 滦南县| 祁阳县| 长阳| 刚察县| 马山县| 泸西县| 敦化市| 南丹县| 普兰店市| 登封市| 独山县| 辽阳市| 扶绥县| 乌苏市| 威信县| 昌乐县| 家居| 磐安县| 于田县| 东乡族自治县| 阳信县| 会昌县| 昌乐县| 鄂托克旗| 平舆县| 永安市| 仁寿县|