本發明公開了一種基于注意力機制與強化學習的多智能體游戲AI設計方法,首先,對智能體原始觀測信息進行基于實體的局部信息劃分并分組;其次,基于每個分組信息表征得到當前時刻的局部策略,根據動作?觀測歷史信息獲得對應局部信息的注意力權重,根據注意力權重對所有局部策略進行聚合得到局部信息策略;最后,將局部信息策略與原始觀測信息作為策略輸入輸出的基準策略進行聚合得到智能體最終的策略。與現有技術相比,本發明解決了多智能體系統中智能體觀測信息冗余問題,能夠有效的提高智能體的學習效率。
聲明:
“基于注意力機制與強化學習的多智能體游戲AI設計方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)