亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

蟲蟲首頁| 資源下載| 資源專輯| 精品軟件
登錄| 注冊

您現(xiàn)在的位置是:蟲蟲下載站 > 資源下載 > 學(xué)術(shù)論文 > 強化學(xué)習(xí)研究綜述

強化學(xué)習(xí)研究綜述

  • 資源大小:1398 K
  • 上傳時間: 2016-03-26
  • 上傳用戶:siloes
  • 資源積分:2 下載積分
  • 標      簽: 強化學(xué)習(xí)

資 源 簡 介

強化學(xué)習(xí)通過試錯與環(huán)境交互獲得策略的改進,其自學(xué)習(xí)和在線學(xué)習(xí)的特點使其成為機器學(xué)習(xí)研究的一個重要分支.該文首先介紹強化學(xué)習(xí)的原理和結(jié)構(gòu);其次構(gòu)造一個二維分類圖,分別在馬爾可夫環(huán)境和非馬爾可夫環(huán)境下討論最優(yōu)搜索型和經(jīng)驗強化型兩類算法;然后結(jié)合近年來的研究綜述了強化學(xué)習(xí)技術(shù)的核心問題,包括部分感知、函數(shù)估計、多agent強化學(xué)習(xí),以及偏差技術(shù);最后還簡要介紹強化學(xué)習(xí)的應(yīng)用情況和未來的發(fā)展方向.

相 關(guān) 資 源

主站蜘蛛池模板: 庐江县| 榆树市| 富源县| 腾冲县| 高平市| 湟中县| 上杭县| 定西市| 太仓市| 定兴县| 桃园县| 宁化县| 高碑店市| 鲁山县| 吉木萨尔县| 光山县| 航空| 邵阳县| 老河口市| 禄劝| 阳东县| 齐河县| 墨脱县| 祁门县| 马关县| 慈利县| 惠来县| 山东省| 永昌县| 崇阳县| 尉犁县| 弋阳县| 华安县| 平度市| 安岳县| 鄂尔多斯市| 通城县| 舒兰市| 天津市| 元谋县| 黄龙县|