本發明公開了一種基于物理信息和深度強化學習的電力系統自動化操作方法及裝置。該方法設定強化學習訓練需要的神經網絡結構、參數、狀態空間、可選擇的動作空間,構建一個深度Q學習智能體,通過最小化線路故障的頻率和嚴重程度來預測自動行動。然后,直接應用電力系統物理信息作為訓練已知限定,減少訓練數據,加快訓練時間。其次,設計用于優化的獎勵函數,訓練選擇不同的動作以達到最大的獎勵,尋找最優的自動化操作。本發明結合物理信息特征,基于DQN算法對電力系統各輸電線路和變電站拓撲進行了優化控制,兼顧了經濟性和有效性。本發明能在較少數據的情況下,實時地進行電力系統穩定控制。
聲明:
“基于物理信息和深度強化學習的電力系統自動化操作方法及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)