本發明是基于強化學習而在自動駕駛時優化資源分配的方法及裝置。本發明涉及用于自動駕駛車輛的優化資源分配所需的方法及裝置。更詳細而言,其特征在于,包括:(a)步驟,計算裝置獲得至少一個注意力傳感器數據后,使注意力網絡計算一個以上的注意力分值;(b)步驟,所述計算裝置使探測網絡至少一個視頻數據,并參照所述視頻數據,生成至少一個自動駕駛用判斷數據;(c)步驟,所述計算裝置使驅動網絡獲得表示行駛中的所述自動駕駛車輛周邊情況變化的至少一個情況數據,并參照所述情況數據,生成至少一個獎勵;(d)步驟,所述計算裝置使所述注意力網絡,以所述獎勵為參照,調整所述神經網絡運算中使用的一個以上參數的至少一部分。
聲明:
“基于強化學習而在自動駕駛時優化資源分配的方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)