本發明提出了一種基于自舉DQN的增強學習深度搜索方法,主要內容包括自舉Deep?Q?Network(DQN)、深度搜索和環境背景;其中自舉Deep?Q?Network包括自舉樣本和自舉DQN,深度搜索包括深度搜索測試和自舉DQN驅動深度搜索,環境背景包括生成在線自舉DQN和自舉DQN驅動。自舉DQN是一種結合了深度學習與深度探索的實用強化學習算法,證明了自舉可以對深度神經網絡產生有效的不確定性估計,也可擴展到大規模的并行系統,在多個時間步驟上對信息進行排序,保證樣本的多樣性;在復雜的環境中自舉DQN作為有效的增強學習中的一種算法,并行處理大量數據,計算成本低,學習效率高,性能表現優異。
聲明:
“基于自舉DQN的增強學習深度搜索方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)