本申請提供了一種基于深度強化學習的自反饋客流控制方法以及裝置。所述基于深度強化學習的自反饋客流控制方法包括:獲取車站的當前時間點的歷史時序數據、仿真數據以及短時預測數據;根據所述歷史時序數據、仿真數據以及短時預測數據獲取客流特征;根據所述客流特征獲取車站設施能力負荷度評價;獲取客流控制策略,所述客流控制策略包括多種控制行為;根據所述車站設施能力負荷度評價以及所述客流控制策略更新當前的車站客流控制決策方案。本申請根據客流歷史時序數據、仿真數據以及短時預測數據對當前時間點的車站設施能力負荷度進行評價,一方面能夠了解當前車站關鍵設施設備能力利用情況,另一方面可以根據當前車站關鍵設施設備能力利用情況反饋更新智能調整車站客流控制決策方案。
聲明:
“基于深度強化學習的自反饋客流控制方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)