本發明涉及一種基于心跳的軟件模塊故障處理方法及系統。該方法包括:1)在故障檢測階段,管理模塊向各任務處理模塊每隔一定時間發送心跳查詢消息,任務處理模塊在接收到心跳查詢消息后將自身的信息添加到心跳響應消息,并反饋給管理模塊;如果經過指定的時間間隔后管理模塊未收到任務處理模塊的心跳響應消息,則判定該任務處理模塊為故障模塊,進入故障處理階段;2)在故障處理階段,管理模塊通知與故障模塊所處理的任務相關聯的其它正常的任務處理模塊釋放分配給故障任務的資源。本發明能夠解決分布式系統中部分軟件模塊已經失效,而未失效軟件模塊無法感知此故障的問題,提高系統可用性與容錯能力、降低系統故障恢復時間。
聲明:
“基于心跳的軟件模塊故障處理方法及系統” 該技術專利(論文)所有權利歸屬于技術(論文)所有人。僅供學習研究,如用于商業用途,請聯系該技術所有人。
我是此專利(論文)的發明人(作者)