本發明提出了基于深度強化學習的盾構最優自主掘進控制方法。深度強化學習決策模塊根據觀測到的反饋的傳感器實測參數,地質前勘測量的參數以及從獎勵函數模塊反饋的獎勵函數值處理獲得總推進力期望值和刀盤扭矩期望值;最優控制模塊處理輸出總推進力實際值和刀盤扭矩實際值;獎勵函數模塊生成獎勵函數值,反饋到通過深度強化學習決策模塊;最優控制模塊輸出的總推進力實際值和刀盤扭矩實際值施加到盾構機上,通過盾構環境交互模塊處理獲得經過盾構環境交互后的傳感器實測參數。本發明減輕盾構司機的工作量,能夠實現完全自主控制的基礎上提升綜合掘進性能,同時實現掘進參數的智能決策與長期綜合掘進性能的多目標動態優化,顯著提高綜合掘進性能。
聲明:
“基于深度強化學習的盾構最優自主掘進控制方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)