目的 基因表達(dá)譜數(shù)據(jù)分析是生物信息學(xué)領(lǐng)域最重要的研究內(nèi)容之一。其可實(shí)現(xiàn)對不同病理分型的腫瘤的正確分類,對腫瘤診斷和治療具有重大意義。方法 本文應(yīng)用壓縮感知算法實(shí)現(xiàn)對胃癌基因表達(dá)譜數(shù)據(jù)的分類,運(yùn)用訓(xùn)練數(shù)據(jù)構(gòu)造冗余字典,采用隨機(jī)分布的規(guī)范行矢量高斯矩陣構(gòu)造感知矩陣,對訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)進(jìn)行感知,利用正交l2-范數(shù)算法對基因表達(dá)譜數(shù)據(jù)進(jìn)行重建,在變換域中采用近鄰法測試判斷數(shù)據(jù)類別,與樣本的實(shí)際類別相比較。結(jié)果 實(shí)驗(yàn)結(jié)果表明,壓縮感知算法與K均值聚類、SVM等其他分類算法相比有較高的分類正確率,且分類速度快,能避免特征選取的問題。結(jié)論 本文方法對疾病的臨床診斷和生物信息學(xué)研究有重要的參考和借鑒作用。
|