本發明涉及人工智能技術領域,提供一種基于強化學習的業務分配方法、裝置、設備及存儲介質,用于提高業務分配的準確性?;趶娀瘜W習的業務分配方法包括:對基于多個參與端的機構私密數據的特征向量信息進行選擇概率預測得到選擇概率;通過選擇概率對特征向量信息進行采樣得到采樣梯度信息;根據采樣梯度信息,對預置業務評估聯邦模型的模型參數進行更新,得到更新聯邦評估模型,并通過更新聯邦評估模型計算獎勵值;通過預置評估器和獎勵值,對特征向量信息進行價值評估,得到參與者貢獻度;根據參與者貢獻度,對多個參與端進行業務分配,得到參與者業務分配信息。此外,本發明還涉及區塊鏈技術,機構私密數據可存儲于區塊鏈中。
聲明:
“基于強化學習的業務分配方法、裝置、設備及存儲介質” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)