本發明公開了一種基于時空數據強化學習的自動駕駛速度控制框架,主要解決自動駕駛汽車難以及時對較遠車輛的急劇變速行為做出反應的延時性問題。該控制框架包括離線訓練:利用現實生活中的車輛駕駛數據對自動駕駛車輛的速度決策進行學習;在線模擬:使用已經訓練好的網絡來檢測自動駕駛車輛在特定場景下的表現。采用本發明的速度控制框架的自動駕駛車輛能夠在復雜的交通環境中有良好的表現,本發明綜合考慮了交通安全性,駕駛員舒適度和交通效率,使用了長短期記憶神經網絡(LSTM),能夠讓自動駕駛汽車在進行速度決策時不只是考慮當前時刻的環境數據,可以同時考慮多個歷史時刻的環境數據,讓自動駕駛車輛能夠在遇到突然的變速行為有更好的表現。
聲明:
“基于時空數據強化學習的自動駕駛速度控制框架” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)