目的 探索利用數(shù)據(jù)挖掘技術(shù)預(yù)測(cè)CD4+ T淋巴細(xì)胞計(jì)數(shù)<350個(gè)/μL和<500個(gè)/μL的可能性和效果,從而為CD4+ T淋巴細(xì)胞計(jì)數(shù)預(yù)測(cè)模型的選取提供參考依據(jù)。方法 收集345名HIV感染男男性接觸者的2837例總淋巴細(xì)胞計(jì)數(shù)、血紅蛋白、血小板計(jì)數(shù)、白細(xì)胞計(jì)數(shù)和紅細(xì)胞計(jì)數(shù),分別建立基于Logistic回歸、線(xiàn)性判別分析、決策樹(shù)、反向傳播多層感知機(jī)和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型,并對(duì)預(yù)測(cè)效果進(jìn)行10折交叉驗(yàn)證。利用敏感度、特異度、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值和受試者操作特征(ROC)曲線(xiàn)下面積對(duì)5種預(yù)測(cè)模型的性能進(jìn)行評(píng)價(jià)。結(jié)果 上述5種模型預(yù)測(cè)CD4<350個(gè)/μL的ROC曲線(xiàn)下面積(Az)分別為0.698、0.697、0.706、0.746和0.745,預(yù)測(cè)CD4<500個(gè)/μL的Az值分別為0.735、0.737、0.724、0.707和0.714,均高于單獨(dú)使用總淋巴細(xì)胞計(jì)數(shù)(Az值分別為0.657和0.691)進(jìn)行預(yù)測(cè)的效果。結(jié)論 數(shù)據(jù)挖掘模型在預(yù)測(cè)CD4+T淋巴細(xì)胞計(jì)數(shù)方面具有一定水平,不同模型在完成不同預(yù)測(cè)任務(wù)時(shí)表現(xiàn)出了不同性能。
|