強化學習通過試錯與環(huán)境交互獲得策略的改進,其自學習和在線學習的特點使其成為機器學習研究的一個重要分支.該文首先介紹強化學習的原理和結構;其次構造一個二維分類圖,分別在馬爾可夫環(huán)境和非馬爾可夫環(huán)境下討論最優(yōu)搜索型和經(jīng)驗強化型兩類算法;然后結合近年來的研究綜述了強化學習技術的核心問題,包括部分感知、函數(shù)估計、多agent強化學習,以及偏差技術;最后還簡要介紹強化學習的應用情況和未來的發(fā)展方向.
標簽:
強化學習
上傳時間:
2016-03-26
上傳用戶:liyanfei