本發明公開了一種基于強化學習的聲吶圖像目標識別方法,包括:(1)將卷積神經網絡的層選擇過程建模為馬爾科夫決策過程;(2)定義強化學習Agent的狀態空間和動作空間;(3)使用強化學習Q?Learn i ng算法讓Agent自動構建出一系列的卷積神經網絡;(4)從自動生成的卷積神經網絡中選出表現較好的網絡模型,調整參數并遷移到目標檢測網絡中,如摘要附圖所示;(5)用聲吶圖像數據集對整個目標檢測網絡進行監督式訓練,完成聲吶圖像的目標識別工作,基于強化學習的Q?Learn i ng算法來自動化卷積神經網絡的構建過程,省去了大量手工調參投入,得到性能良好的卷積神經網絡,提高聲吶圖像識別的工作效率。
聲明:
“基于強化學習的聲吶圖像目標識別方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)