目的 基于復(fù)雜生物網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)方法,識(shí)別乳腺癌相關(guān)的邊緣生物標(biāo)志物,構(gòu)建乳腺癌生存預(yù)后模型,從而在系統(tǒng)水平解釋乳腺癌的發(fā)生發(fā)展機(jī)制。方法 首先基于TCGA數(shù)據(jù)庫(kù)的RNAseq數(shù)據(jù)識(shí)別乳腺癌相關(guān)的lncRNA-mRNA共表達(dá)擾動(dòng)關(guān)系對(duì),進(jìn)一步構(gòu)建乳腺癌相關(guān)的lncRNA-mRNA共表達(dá)擾動(dòng)網(wǎng)絡(luò)并對(duì)網(wǎng)絡(luò)中的關(guān)鍵基因進(jìn)行通路富集分析。然后,基于乳腺癌相關(guān)的lncRNA-mRNA關(guān)系對(duì),構(gòu)建乳腺癌預(yù)測(cè)的分類器模型。最后,通過(guò)Lasso回歸篩選變量構(gòu)建多因素Cox比例風(fēng)險(xiǎn)回歸模型對(duì)乳腺癌患者進(jìn)行生存預(yù)后分析。結(jié)果 構(gòu)建了乳腺癌相關(guān)的lncRNA-mRNA共表達(dá)擾動(dòng)網(wǎng)絡(luò),其中的關(guān)鍵基因富集分析得到32條與乳腺癌相關(guān)的生物通路。分類預(yù)測(cè)模型的靈敏度、特異度和準(zhǔn)確性分別為98.2%、85.2%、97.6%。Lasso回歸共篩選出22個(gè)和乳腺癌生存預(yù)后顯著相關(guān)的lncRNA-mRNA互作關(guān)系對(duì),進(jìn)而構(gòu)建的生存預(yù)測(cè)模型把訓(xùn)練集和測(cè)試集的乳腺癌患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,兩組患者生存預(yù)后均存在明顯差異。結(jié)論 LncRNA-mRNA共表達(dá)互作網(wǎng)絡(luò)中的關(guān)鍵基因以及乳腺癌相關(guān)的邊緣生物標(biāo)志物大多被證明與乳腺癌相關(guān)。同時(shí)基于邊緣生物標(biāo)志物的預(yù)后模型可以穩(wěn)健地預(yù)測(cè)乳腺癌患者的生存預(yù)后狀態(tài),有利于從網(wǎng)絡(luò)層面更好地理解乳腺癌的發(fā)生發(fā)展機(jī)制。
|