本發明提供一種基于深度強化學習的自動化網絡安全檢測方法,所述方法包括:構建環境信息獲取模塊,所述環境信息獲取模塊用于從待測網絡和待測主機中掃描環境信息;基于所述環境信息獲取模塊,獲取從環境中掃描到的基本信息,構建能夠被智能體理解的待測環境狀態矩陣;構建智能體;基于獲取的所述待測環境狀態矩陣及獎勵模塊的獎勵信息,確定智能體的行為策略;基于智能體的行為策略,采取行為,確定行為在待測環境中的執行結果和影響,更新所述獎勵模塊的獎勵信息,指導智能體更新神經網絡參數。根據本發明的方案,實現有效的對網絡環境進行自動化網絡安全檢測,以解決人工網絡安全檢測成本高,專業技術要求高的問題。
聲明:
“基于深度強化學習的自動化網絡安全檢測方法” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)