模塊化免疫神經(jīng)網(wǎng)絡(luò)模型在計算機病毒分類檢測中的
0 引言
本文引用地址:http://www.104case.com/article/202688.htm隨著信息技術(shù)的發(fā)展和互聯(lián)網(wǎng)應(yīng)用的普及,計算機系統(tǒng)受到計算機病毒的威脅。計算機病毒分類檢測,指將可疑文件作為輸入,執(zhí)行某病毒檢測算法后輸出結(jié)果(無毒、帶毒/帶何種毒)的過程,實質(zhì)上是對文件的分類。病毒分類檢測應(yīng)屬于模式識別范疇。由于單一的技術(shù)無法有效地對抗計算機病毒,技術(shù)的融合并用及智能化,將是未來計算機病毒檢測的趨勢。故采用免疫算法和神經(jīng)網(wǎng)絡(luò)的新型網(wǎng)絡(luò)模型,對計算機病毒分類檢測進行研究。
1 模塊化免疫神經(jīng)網(wǎng)絡(luò)模型的提出
人工神經(jīng)網(wǎng)絡(luò)和人工免疫系統(tǒng)都是受生物學(xué)的啟發(fā)發(fā)展而來的理論和技術(shù),兩者在生物學(xué)原理和人工原理上各有異同。研究表明,免疫原理可以應(yīng)用到神經(jīng)網(wǎng)絡(luò)中,以提高神經(jīng)網(wǎng)絡(luò)的性能;反之,神經(jīng)網(wǎng)絡(luò)理論也可以應(yīng)用到人工免疫系統(tǒng)中,從而產(chǎn)生一個相互之間可以受益的研究領(lǐng)域。
圖1中,抗原(Ag)表示神經(jīng)網(wǎng)絡(luò)中輸入神經(jīng)元到輸出神經(jīng)元的權(quán)向量Wk(由抗體Ab和自體庫集S共同作用后,基本調(diào)節(jié)好的權(quán)向量),基于計算機病毒的入侵檢測中,代表一類網(wǎng)絡(luò)數(shù)據(jù)包,以二進制串表示。抗體(Ab)表示神經(jīng)網(wǎng)絡(luò)中的輸入樣本。S代表自體庫集合。權(quán)值及輸入樣本和輸出單元都使用二進制,即只使用0和1表示,如圖2。

首先抗體庫中的向量都會和白體庫的向量進行識別。如果抗體庫中的向量一旦和自體庫中的向量匹配,則會進行剪枝操作。
沿用傳統(tǒng)的抗體網(wǎng)絡(luò)特征,規(guī)定ξj表示網(wǎng)絡(luò)中抗體j的抗原濃度,即抗體j所能識別的抗原個數(shù)。1個抗體細胞k與某種抗原細胞的親和力,由權(quán)向量與該抗體的漢明距離(Hamming)決定,可由式(1)得到與Ag可能性的最大狀態(tài)序列δ:

親和力δ越大,說明這種抗體能夠?qū)Υ丝乖M行較好的應(yīng)答,保留。相反,通過剪枝的方式,從網(wǎng)絡(luò)中刪掉。把不與自身反應(yīng)的抗體保留,進行對抗原的識別,進行后續(xù)的工作。
否定選擇后的抗體與抗原進行神經(jīng)網(wǎng)絡(luò)的作用,規(guī)則如上,如果抗體不匹配,按照已有的神經(jīng)網(wǎng)絡(luò)的權(quán)值算法的改進步驟進行權(quán)值的調(diào)整,以達到在給定抗體空間中擁有最大的解空間度,即2個抗體之間有最大的不相同度。
更新抗體種群,經(jīng)過若干次的疊代運算,把抗體種群訓(xùn)練收斂于一個較穩(wěn)定的集合,即學(xué)習(xí)過程完畢。學(xué)習(xí)完成后,可以用于計算機病毒檢測中。
2 模型設(shè)計思路
整個網(wǎng)絡(luò)的競爭學(xué)習(xí)步驟分為2部分:
第1部分:首先從抗體庫里根據(jù)概率密度P(Ab)選擇出1個抗體進行輸入。并和自體庫S進行運算,并設(shè)定閾值ε,當(dāng)滿足式(2)時:

抗體經(jīng)過了自體耐受,變?yōu)槌墒斓臋z測器,且不與自體發(fā)生免疫應(yīng)答,是合格的檢測器。如果超過閾值ε,則從網(wǎng)絡(luò)中刪除此抗體節(jié)點。抗體Ab1和自體集S中的S1產(chǎn)生了免疫應(yīng)答。
第2部分:經(jīng)過自體耐受的抗體分別和某個抗原Agk進行作用,在抗體內(nèi)部設(shè)定1個ξi,一旦抗原的權(quán)向量和抗體的漢明距離超過閾值ε,ξj增加1,如果ξj長時間等于0,將此抗體從網(wǎng)絡(luò)中刪去。當(dāng)ξj增加到1個常值M時,不再繼續(xù)增加,啟動1個計時器,按一定的間隔時間t遞減ξj,避免了長時間未產(chǎn)生應(yīng)答的抗體繼續(xù)殘留在抗體庫中。新模型中的神經(jīng)網(wǎng)絡(luò)處理單元如圖3。
評論