本發明公開了基于強化學習的病床資源配置優化方法、系統及終端,涉及資源配置優化技術領域,其技術方案要點是:獲取多個科室的病床配置數據,并對單一科室的在院患者數進行時間差異分析,得到時間差異分布信息;結合病床配置數據和時間差異分布信息,模擬患者入出院過程建立智能體需要的狀態空間、動作空間以及獎賞函數;智能體根據策略函數選擇并執行當前狀態對應的動作過程中,以最大化累計獎賞為目標,得到多個科室的病床資源配置優化策略。本發明采用機器強化學習(RL)的方法訓練智能體,考慮不同科室疾病在時間分布上的差異情況,使得床資源配置優化策略更加符合實際情況,有效提高了病床資源配置優化的準確性與可靠性。
聲明:
“基于強化學習的病床資源配置優化方法、系統及終端” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)