?? 強化學習技術資料

?? 資源總數:27402
?? 源代碼:14773

?? 強化學習熱門資料

查看全部27402個資源 ?

  針對強化學習在連續狀態連續動作空間中的維度災難問題,利用BP神經網絡算法作為值函數逼近策略,設計了自動駕駛儀。并引入動作池機制,有效避免飛行仿真中危險動作的發生。首先,建立了TD強化學習算法框架;然后根據經驗將舵機動作合理分割為若干組,在不同的飛行狀態時,調取不同組中的動作;...

?? ?? 劉江林1420
?? 強化學習資料分類