本申請揭示了一種基于強化學習模型的信息控制方法、裝置、計算機設備和存儲介質,所述方法包括:獲取當前時間與信號燈所處路口的圖像;若所述當前時間與所述信號燈所處路口的圖像符合使用條件,則從所述信號燈所處路口的圖像中提取出指定狀態特征;將所述指定狀態特征輸入所述信號燈動作預測模型中,從而得到預測動作;所述信號燈動作預測模型基于強化學習模型并通過具有指定數據結構的樣本數據訓練得到的,所述指定數據結構由多個數據塊構成,具有同一信號燈相位和同一預測動作的樣本數據被存在同一個所述數據塊中;根據所述預測動作控制所述信號燈。從而使信號燈的控制更適用于更多的交通狀況,更具魯棒性。
聲明:
“基于強化學習模型的信息控制方法、裝置和計算機設備” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)