本發明實施例提供了一種用于環境監測與控制的強化學習方法及系統,方法包括:將現場實際環境映射為學習模型,所述學習模型是根據所述現場實際環境中智能體的狀態、動作以及學習目標建立的;基于強化學習后的所述學習模型,對所述實際環境進行監測與控制,其中,所述強化學習后的所述學習模型是通過在線的全連接深度網絡強化學習得到的。本發明實施例提供的一種用于環境監測與控制的強化學習方法及系統,通過在線的全連接深度網絡強化學習方法智能實時對環境進行監測與控制,滿足不同環境下的不同需求,降低運行成本具有自適應和預測能力,可應對各種復雜的展廳環境。
聲明:
“用于環境監測與控制的強化學習方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)