目的剪接位點(diǎn)是真核細(xì)胞生物基因序列中外顯子和內(nèi)含子的相鄰區(qū)域,如果能準(zhǔn)確預(yù)測(cè)基因序列中的剪接位點(diǎn),就能將基因中的表達(dá)區(qū)域和非表達(dá)區(qū)域分開(kāi).方法從機(jī)器學(xué)習(xí)的角度出發(fā),提出了一種有效的特征選擇算法用于剪接位點(diǎn)的建模和預(yù)測(cè).該算法首先將初始鏈模型中每一對(duì)父子節(jié)點(diǎn)作為特征量提取,然后通過(guò)遺傳算法和最大后驗(yàn)分類器進(jìn)行特征選擇.結(jié)果及結(jié)論對(duì)剪接位點(diǎn)數(shù)據(jù)的預(yù)測(cè)結(jié)果顯示,這種新算法能夠有效地優(yōu)化鏈模型的結(jié)構(gòu),提高對(duì)剪接位點(diǎn)的預(yù)測(cè)能力.同時(shí),經(jīng)過(guò)優(yōu)化的模型也有助于了解真核細(xì)胞中基因轉(zhuǎn)錄和表達(dá)的過(guò)程.
|