本發明公開了融合深度強化學習和遺傳算法的短程支線航班調度方法,DRL模塊利用編碼器提取數據在高維空間的特征表達,解碼器則根據規則和概率選擇路徑,最后使用強化學習的訓練方法更新參數;訓練并迭代了足夠多次網絡參數后,測試數據能通過網絡計算得到一系列強大的“初始解”將“初始解”所組成的“種群”將作為輸入傳入遺傳算法得到最終解。本發明有益效果:本發明深度強化學習完成了從問題輸入到問題輸出的端到端的求解方案,具有良好的泛化性;局部搜索容易陷入局部最優陷阱,依靠DRL提供的好的初始種群可以輔助搜索過程跳出“局優”;對于一定規模的問題,神經網絡只需一次預訓練,求解時響應速度快,提高搜索效率,減少搜索空間和時間。
聲明:
“融合深度強化學習和遺傳算法的短程支線航班調度方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)