本發明公開了一種用強化學習算法對酒店客房進行收益管理的方法,包括狀態、智能體、動作和回報;一個所述智能體每次從環境中獲取一個狀態數據,作為它對當前環境狀態的認知,以及一組可執行的動作,所述智能體根據狀態從一組動作中采取一個動作進行執行,執行之后所述環境返回一個回報;所述狀態指收益管理系統能夠獲取到的各種酒店運營數據;所述動作指客房的定價和超售量。本發明采用強化學習算法訓練模型替代了傳統收益管理系統中手工編制的數學模型,降低軟件成本,提高預測準確度的效果,利用歷史數據和在線數據訓練模型,使其達到某種優化目標,相比傳統方法的人工建模無需高深的領域知識,并對各種情況有著更廣泛的適應性。
聲明:
“用強化學習算法對酒店客房進行收益管理的方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)