本發明公開了一種基于課程強化學習的游戲跟隨方法和系統,包括:獲取游戲接口,建立訓練環境并定義課程導航任務;采用策略梯度的強化學習算法訓練策略;將地圖上所有可到達的點分別作為起點和目標點對策略進行測試。本發明通過對課程導航任務的訓練,建立一種根據環境狀態直接給出動作指令的跟隨策略,解決了現有技術中跟隨靈活性差,對復雜地形適應性差的問題。
聲明:
“基于課程強化學習的游戲跟隨方法和系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)