證候是中醫(yī)理論的核心.準確判定冠心病患者屬于何種證候是中醫(yī)有效治療的重要前提.本文中,基于冠心病臨床流行病學調(diào)查得到的1069例中醫(yī)四診信息和相應的辨證結果數(shù)據(jù),用四類數(shù)據(jù)挖掘方法和一類統(tǒng)計方法作為預測模型對其學習和預測.采用十倍交叉驗證方法得到的三個指標--敏感性,特異性和正確率以及運行時間來衡量算法的性能,并從每類方法中選擇一個最優(yōu)者進行對比研究.運行結果顯示Bayesian network是貝葉斯方法中性能最好的,敏感性90.17%,特異性88.89%,正確率89.24%,運行時間0.53s;徑向基神經(jīng)網(wǎng)絡(RBFN)是神經(jīng)網(wǎng)絡中最好的,敏感性84.07%,特異性94.32%,正確率91.49%,運行時間1.03s;Libsvm是支持向量機(SVM)方法中最好的,敏感性91.19%,特異性93.15%,正確率92.61%,運行時間1.0s;ADTree是決策樹方法中最好的,敏感性83.73%,特異性95.99%,正確率92.61%,運行時間2.78s;Logistic回歸的敏感性是88.14%,特異性94.44%,正確率是92.70%,運行時間1.09s.綜合各項性能指標,SVM最好,Logistic回歸次之,決策樹、貝葉斯和神經(jīng)網(wǎng)絡依次次之.本文的對比研究為準確判別冠心病的中醫(yī)證候提供適宜的數(shù)據(jù)挖掘方法.
|