本發明涉及一種基于深度強化學習和聯盟鏈的能量交易方法、裝置及設備,通過采集能量交易場N個影響買賣雙方的狀態向量構成第一狀態矩陣,在神經網絡模型中對狀態矩陣進行處理、分析得到動作矩陣、第二狀態矩陣和獎勵矩陣,還采用第一狀態矩陣、動作矩陣、第二狀態矩陣和獎勵矩陣對神經網絡模型進行訓練,得到神經網絡訓練模型,基于神經網絡訓練模型和聯盟鏈的能量交易方法應用的電動汽車的P2P電量交易中,使得參與交易的電動汽車長期收益最大化,并引入了聯盟鏈,保證電動汽車電量交易的隱私安全,解決了在基于聯盟鏈的P2P電量交易中,如何讓買方和賣方得到最大長期效益的技術問題。
聲明:
“基于深度強化學習和聯盟鏈的能量交易方法、裝置及設備” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)