本發明公開了一種基于用戶體驗分析的深度強化學習式智能門鎖系統及裝置。首先,我們設計出智能門鎖系統的強化學習模型,并提出改進的線上線下強化學習算法,該算法對用戶體驗質量(QoE)分析,通過分析將搜索空間的狀態?行為對降維;其次,為克服強化學習帶有的延遲獎勵或者懲罰,而影響到后續學習過程,為此,我們采用帶有臨時記錄功能的資格跡進行信用評分,從而避免強化學習中具有的延遲賞罰的弊端。最后,該算法作為核心模塊,設計出智能門鎖系統的裝置,從而實現多元化、智能化學習式的開/關鎖系統。避免了用戶用人臉/指紋/密碼開鎖的費時費心的操作,增強門鎖的智能化和人性化。
聲明:
“基于用戶體驗分析的深度強化學習式智能門鎖系統及裝置” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)