本公開提供了“使用深度強化學習的自動導航”。公開了一種用于訓練自主車輛到達目標位置的方法。所述方法包括檢測模擬環境中的自主車輛的狀態,以及使用神經網絡將所述車輛從初始位置導航到目標目的地。在所述訓練階段期間,對于所述自主車輛采取的期望動作,第二神經網絡可以對第一神經網絡進行獎勵,并且對于所述自主車輛采取的不期望的動作,可以對所述第一神經網絡進行懲罰。本文還公開并要求保護對應的系統和計算機程序產品。
聲明:
“使用深度強化學習的自動導航” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)