基奇PCA的貝葉斯網絡分糞器研究
對所用的貝葉斯網絡學習算法進行CI測試,最壞情況下的時間復雜度為O(N4)。由表2可知,采用PCA降維后,算法所用時間約占原構造算法時間的34.58%,貝葉斯網絡結構的學習效率有所提高。
經PCA降維,IRIS數據集的屬性由4個減少為3個;ZooData的屬性由18個減少到12個;Glass Identification Data的屬性由11個減少為8個。屬性數量的減少使得網絡結構更為簡單,并且由表2可以看出,經PCA降維后進行分類的結果準確率不低于不經過降維直接由數據集學習得到的貝葉斯網絡分類結果的準確率。
經PCA降維后的網絡結構如圖1~圖3所示。
用圖1中的結點V4、圖2中的結點F13及圖3中的結點F8是類別標簽結點,其余結點為原數據結點的線性變換,無實際意義。實驗2用經過PCA降維后數據構造的貝葉斯網絡器(BN)與樸素貝葉斯(NB)分類器、TAN分類器分類對以上3組數據進行分類。分類準確率的比較如表3所示。
由實驗1可知,使用PCA降維后構造的貝葉斯網絡與未使用降維數據學習得到的網絡分類結果正確率相差不大,而這樣構造的網絡分類結果比其他分類器正確率高很多,同時使用降維后數據構造的網絡還具有結點少、結構簡單、學習效率高等優點。
5 結束語
基于貝葉斯網絡結構學習中依賴分析方法需進行指數級的CI測試因而存在結點集較大時計算效率低的缺點,提出了將數據集先經過PCA主元分析的方法降維。減少結點數,再用降維后的數據進行貝葉斯網絡結構學習的方法,提高了網絡結構學習的效率,并通過提高學習到的網絡結構的正確性保證了較好的分類結果。此外。構建的網絡還具有結點少、結構簡單的特點,減少了網絡的復雜性。
評論