本發明揭示了一種基于深度強化學習和深度殘差收縮網絡的投資方法及智能體,通過構建策略神經網絡,以實現下一個交易周期的收益率最高;用訓練完的策略函數獲取下一個交易周期的資產分配權重,并調整資產在加密貨幣市場中的分配,以此實現最優策略。本發明強化學習的策略函數在使用資產價格輸入神經網絡的基礎上,通過引入額外的特征,幫助策略神經網絡完善了對市場環境的分析,并采用了深度的殘差收縮結構,極大的提高的智能體的學習能力和對于最優投資組合策略的探索能力,并且避免了訓練時候的梯度消失問題的出現,使得策略網絡可以進行有效的訓練,并找出每一個狀態下的最有效動作。
聲明:
“基于深度強化學習和深度殘差收縮網絡的投資方法及智能體” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)