?? 29.txt
字號(hào):
發(fā)信人: GzLi (笑梨), 信區(qū): DataMining
標(biāo) 題: [合集]給個(gè)建議~~關(guān)于醫(yī)學(xué)數(shù)據(jù)挖掘的~
發(fā)信站: 南京大學(xué)小百合站 (Sat May 10 18:47:55 2003)
eehsay (反函數(shù)) 于Sun May 4 17:52:32 2003)
提到:
用決策樹(shù)進(jìn)行醫(yī)學(xué)數(shù)據(jù)的挖掘。
C5處理網(wǎng)上下載的數(shù)據(jù)庫(kù)可以得到較好的結(jié)果的
但是實(shí)際中應(yīng)用到我拿到的數(shù)據(jù)結(jié)果很差,錯(cuò)誤率很高~
我的樣本只有不到200個(gè),而且每個(gè)屬性都有較多的缺損值~
大家有什么建議嘛,我是該放棄還是可以選擇其他的方法試試,
或者在數(shù)據(jù)的預(yù)處理方面做點(diǎn)工作〉?
GzLi (笑梨) 于Sun May 4 20:32:26 2003)
提到:
1.可以考慮用fuzzy的方法處理缺失值,
2. 你用來(lái)處理網(wǎng)上數(shù)據(jù)結(jié)果好,不一定代表你已經(jīng)很好掌握了c5
3. 可以使用其它方法試驗(yàn)一下。
比如nn
【 在 eehsay (反函數(shù)) 的大作中提到: 】
: 用決策樹(shù)進(jìn)行醫(yī)學(xué)數(shù)據(jù)的挖掘。
: C5處理網(wǎng)上下載的數(shù)據(jù)庫(kù)可以得到較好的結(jié)果的
: 但是實(shí)際中應(yīng)用到我拿到的數(shù)據(jù)結(jié)果很差,錯(cuò)誤率很高~
: 我的樣本只有不到200個(gè),而且每個(gè)屬性都有較多的缺損值~
: 大家有什么建議嘛,我是該放棄還是可以選擇其他的方法試試,
: 或者在數(shù)據(jù)的預(yù)處理方面做點(diǎn)工作〉?
eehsay (反函數(shù)) 于Sun May 4 22:19:11 2003)
提到:
要求得到顯示規(guī)則的,用nn不行吧~
還有當(dāng)數(shù)據(jù)缺失到多少的時(shí)候此屬性不適于考慮呢?
??%
【 在 GzLi (笑梨) 的大作中提到: 】
: 1.可以考慮用fuzzy的方法處理缺失值,
: 2. 你用來(lái)處理網(wǎng)上數(shù)據(jù)結(jié)果好,不一定代表你已經(jīng)很好掌握了c5
: 3. 可以使用其它方法試驗(yàn)一下。
: 比如nn
: 【 在 eehsay (反函數(shù)) 的大作中提到: 】
strawman (獨(dú)上江樓思渺然) 于Mon May 5 09:58:21 2003)
提到:
你可以試試用現(xiàn)有訓(xùn)練集訓(xùn)練一個(gè)ensemble,然后用ensemble產(chǎn)生新的訓(xùn)練集,然后用
新產(chǎn)生的訓(xùn)練集用c4.5rules產(chǎn)生規(guī)則。
【 在 eehsay (反函數(shù)) 的大作中提到: 】
: 要求得到顯示規(guī)則的,用nn不行吧~
: 還有當(dāng)數(shù)據(jù)缺失到多少的時(shí)候此屬性不適于考慮呢?
: ??%
: 【 在 GzLi (笑梨) 的大作中提到: 】
GzLi (笑梨) 于Mon May 5 11:50:28 2003)
提到:
索性告訴他參考哪篇文章唄
Zhi-Hua Zhou Yuan Jiang Medical diagnosis with C4.5 rule preceded
by artificial neural network ensemble Information Technology in
Biomedicine, IEEE Transactions on On page(s): 37- 42 Volume: 7, Issue:
1, Mar 2003
不過(guò)這樣的工作太復(fù)雜了,連c4.5都做不出結(jié)果,上面的太難。
不妨參考這個(gè)
C. Z. Ye, J. Yang, D.Y. Geng, Y. Zhou, and N.Y. Chen, Fuzzy Rules
to Predict Degree of Malignancy in Brain Glioma, Medical&Biological
Computing and Engineering, 40(2002) 145-152
我做的東西可惜正在審還沒(méi)有結(jié)果。
【 在 strawman (獨(dú)上江樓思渺然) 的大作中提到: 】
: 你可以試試用現(xiàn)有訓(xùn)練集訓(xùn)練一個(gè)ensemble,然后用ensemble產(chǎn)生新的訓(xùn)練集,然后用
: 新產(chǎn)生的訓(xùn)練集用c4.5rules產(chǎn)生規(guī)則。
: 【 在 eehsay (反函數(shù)) 的大作中提到: 】
daniel (飛翔鳥(niǎo)) 于Mon May 5 16:26:07 2003)
提到:
【 在 eehsay (反函數(shù)) 的大作中提到: 】
: 用決策樹(shù)進(jìn)行醫(yī)學(xué)數(shù)據(jù)的挖掘。
: C5處理網(wǎng)上下載的數(shù)據(jù)庫(kù)可以得到較好的結(jié)果的
: 但是實(shí)際中應(yīng)用到我拿到的數(shù)據(jù)結(jié)果很差,錯(cuò)誤率很高~
: 我的樣本只有不到200個(gè),而且每個(gè)屬性都有較多的缺損值~
: 大家有什么建議嘛,我是該放棄還是可以選擇其他的方法試試,
: 或者在數(shù)據(jù)的預(yù)處理方面做點(diǎn)工作〉?
這個(gè)問(wèn)題不是換一種學(xué)習(xí)方法就能解決的。首先你的樣本太少,如果用交叉驗(yàn)證
等手段來(lái)估計(jì)訓(xùn)練好的系統(tǒng)的誤差,其估計(jì)結(jié)果的可信度是很低的。也就是說(shuō),
即使你估計(jì)出來(lái)錯(cuò)誤率很低,也未必是真的低。更大的問(wèn)題是每個(gè)屬性都有較多
的缺失值。C4.5對(duì)缺失值的處理能力已經(jīng)算不錯(cuò)了,但如果缺失值多到一定程度,
沒(méi)什么機(jī)器學(xué)習(xí)方法能處理得了(你還可以試試貝葉斯網(wǎng),但我對(duì)此并不樂(lè)觀)。
所以,如果一定要做,一方面是多收集數(shù)據(jù)(這可以降低缺失率,另外也可以
增加估計(jì)的可信度),另一方面是做預(yù)處理,盡可能利用一些領(lǐng)域知識(shí)。
daniel (飛翔鳥(niǎo)) 于Mon May 5 16:30:31 2003)
提到:
【 在 GzLi (笑梨) 的大作中提到: 】
: 索性告訴他參考哪篇文章唄
: Zhi-Hua Zhou Yuan Jiang Medical diagnosis with C4.5 rule preceded
: by artificial neural network ensemble Information Technology in
: Biomedicine, IEEE Transactions on On page(s): 37- 42 Volume: 7, Issue:
: 1, Mar 2003
: 不過(guò)這樣的工作太復(fù)雜了,連c4.5都做不出結(jié)果,上面的太難。
過(guò)段時(shí)間這玩意兒的代碼或者演示版可能會(huì)被share出來(lái)
: 不妨參考這個(gè)
: C. Z. Ye, J. Yang, D.Y. Geng, Y. Zhou, and N.Y. Chen, Fuzzy Rules
: to Predict Degree of Malignancy in Brain Glioma, Medical&Biological
: Computing and Engineering, 40(2002) 145-152
: 我做的東西可惜正在審還沒(méi)有結(jié)果。
: 【 在 strawman (獨(dú)上江樓思渺然) 的大作中提到: 】
eehsay (反函數(shù)) 于Tue May 6 16:41:32 2003)
提到:
葉的那篇文章在那里可以找到?
【 在 GzLi (笑梨) 的大作中提到: 】
: 索性告訴他參考哪篇文章唄
: Zhi-Hua Zhou Yuan Jiang Medical diagnosis with C4.5 rule preceded
: by artificial neural network ensemble Information Technology in
: Biomedicine, IEEE Transactions on On page(s): 37- 42 Volume: 7, Issue:
: 1, Mar 2003
: 不過(guò)這樣的工作太復(fù)雜了,連c4.5都做不出結(jié)果,上面的太難。
: 不妨參考這個(gè)
: C. Z. Ye, J. Yang, D.Y. Geng, Y. Zhou, and N.Y. Chen, Fuzzy Rules
: to Predict Degree of Malignancy in Brain Glioma, Medical&Biological
: Computing and Engineering, 40(2002) 145-152
: 我做的東西可惜正在審還沒(méi)有結(jié)果。
: 【 在 strawman (獨(dú)上江樓思渺然) 的大作中提到: 】
?? 快捷鍵說(shuō)明
復(fù)制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號(hào)
Ctrl + =
減小字號(hào)
Ctrl + -