本發明公開了一種深度強化學習方法、裝置、肺結節患者隨診流程規劃方法、系統、介質和設備,深度強化學習方法包括:訓練基于肺結節形態、隨診檢查行為和回饋得分的深度Q網絡;其中,通過用于預測肺結節形態特征的動態預測器,計算肺結節未來的形態特征,填補用于進行所述隨診檢查行為時機決策的狀態信息。通過本發明,解決了強化學習用于肺結節患者隨診流程規劃等臨床檢查行為時機決策時,由于檢查行為在時間軸上的稀疏性導致的狀態信息更新不及時,影響時機決策效果的問題。
聲明:
“深度強化學習方法、裝置、肺結節患者隨診流程規劃方法、系統、介質和設備” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)