新聞中心

        EEPW首頁(yè) > 測(cè)試測(cè)量 > 設(shè)計(jì)應(yīng)用 > 基于Alpha-NMF的AD樣本分類及特異性基因選擇方法

        基于Alpha-NMF的AD樣本分類及特異性基因選擇方法

        作者: 時(shí)間:2012-05-25 來(lái)源:網(wǎng)絡(luò) 收藏

        1.2 算法
        算法是NMF算法的一種改進(jìn),它是針對(duì)信號(hào)處理所提出的一種新的算法。
        算法的數(shù)學(xué)模型為:
        c.jpg

        2 非負(fù)矩陣分解在基因表達(dá)譜數(shù)據(jù)中的應(yīng)用
        2.1 數(shù)據(jù)預(yù)處理
        文中所選的實(shí)驗(yàn)數(shù)據(jù)為基因表達(dá)綜合數(shù)據(jù)庫(kù)(GEO)中23組大腦海馬區(qū)域(HIP)和23組內(nèi)嗅區(qū)皮質(zhì)(EC)的AD,54 675個(gè)基因表達(dá)數(shù)據(jù);其中海馬區(qū)域的基因數(shù)據(jù)集由13個(gè)control AD和10個(gè)affected AD組成,內(nèi)鼻皮質(zhì)區(qū)域的基因數(shù)據(jù)集由13個(gè)control AD樣本和10個(gè)affectedAD樣本組成。由于基因表達(dá)譜數(shù)據(jù)的復(fù)雜性,在進(jìn)行聚類分析前必須先進(jìn)行預(yù)處理和數(shù)據(jù)轉(zhuǎn)換等過(guò)程。本文先采用小波變換(wave let transform,WT)對(duì)數(shù)據(jù)進(jìn)行降噪,然后通過(guò)微陣列顯著性分析(significance analysis of microarrays,SAM)工具箱篩選出顯著變化的上下調(diào)基因。
        2.2 Alpha-NMF算法應(yīng)用于基因表達(dá)譜數(shù)據(jù)
        Alpha-NMF算法被提出后,至今還設(shè)被應(yīng)用于基因表達(dá)數(shù)據(jù)中,通過(guò)大量的實(shí)驗(yàn),證明了Alpha-NMF算法能夠有效的應(yīng)用到該領(lǐng)域中,相比傳統(tǒng)NMF算法,其算法穩(wěn)定性和準(zhǔn)確率明顯較高。
        基因表達(dá)譜數(shù)據(jù)的Alpha-NMF混合模型如圖1所示。Y表示mxn維基因表達(dá)譜數(shù)據(jù),每一行表示一個(gè)樣本集,每一列表示一個(gè)基因在不同條件下的表達(dá)水平。yij表示第j個(gè)基因在條件i下的表達(dá)水平。通常nm。

        本文引用地址:http://www.104case.com/article/193834.htm

        f.jpg


        任一樣本yi可以表示為:
        e.jpg
        也就是說(shuō)每一個(gè)樣本可以近似看做是非負(fù)矩陣X的行向量的非負(fù)線性組合,組合系數(shù)是矩陣A對(duì)應(yīng)行向量的分量。把分解后的矩陣X的每一行稱為一個(gè)集合基因。矩陣A的第k列為X的第k個(gè)集合基因的系數(shù),若矩陣X能表征原始數(shù)據(jù)的局部特征,則系數(shù)矩陣A與樣本類別緊密相關(guān),即類別c1對(duì)于特征k的貢獻(xiàn)大,而c2對(duì)于特征k的貢獻(xiàn)小。對(duì)于每一個(gè)集合基因(圖2為HIP數(shù)據(jù)經(jīng)Alpha-NMF算法,α=0.5時(shí)分解后相關(guān)系數(shù)為0.97集合基因的柱狀圖),若元素的值相對(duì)較大,說(shuō)明其對(duì)應(yīng)的基因j與AD緊密相關(guān)。

        g.jpg



        3 實(shí)驗(yàn)結(jié)果與分析
        首先采用WT-SAM分別對(duì)HIP和EC數(shù)據(jù)進(jìn)行預(yù)處理,篩選后的基因數(shù)分別為13 587個(gè)、6 567個(gè),再對(duì)數(shù)據(jù)進(jìn)行菲負(fù)化處理,然后通過(guò)Alphs-NMF算法進(jìn)行分解,利用分解后的A矩陣進(jìn)行聚類,本文采用k均值聚類對(duì)A的行向量進(jìn)行聚類,得到一聚類結(jié)果。對(duì)于矩陣X,設(shè)定一閾值,篩選出集合基因中大于該閾值的信息基因。



        關(guān)鍵詞: Alpha-NMF 樣本 分類 方法

        評(píng)論


        相關(guān)推薦

        技術(shù)專區(qū)

        關(guān)閉
        主站蜘蛛池模板: 平凉市| 邛崃市| 民勤县| 台中市| 年辖:市辖区| 贡嘎县| 罗城| 二手房| 台南县| 浦北县| 德钦县| 襄樊市| 平乡县| 昭通市| 资溪县| 股票| 新津县| 繁峙县| 孙吴县| 新源县| 曲阳县| 敦化市| 清河县| 鄂伦春自治旗| 尼木县| 富宁县| 应用必备| 原平市| 沽源县| 区。| 商南县| 名山县| 腾冲县| 内乡县| 丰城市| 锦州市| 赤水市| 奉新县| 关岭| 贵港市| 灵寿县|