?? 76.txt
字號:
發(fā)信人: GzLi (笑梨), 信區(qū): DataMining
標(biāo) 題: 特征選擇講座后的討論
發(fā)信站: 南京大學(xué)小百合站 (Sun Dec 1 23:49:55 2002), 站內(nèi)信件
zz from 水木清華 AI
發(fā)信人: xinjian (新兒~~勇于承認(rèn)自己的無知~~方能無畏), 信區(qū): AI
標(biāo) 題: Re: 有沒有人去聽今天那個feature selection的講座
發(fā)信站: BBS 水木清華站 (Thu Nov 28 17:04:46 2002), 站內(nèi)
偶去聽了,有些失望,沒有什么新東西
偶想想
她再對feature selection進(jìn)行一些介紹后
(從定義,搜索方法,到boosting,bagging,svm,multi-object)
說已有的幾個誤解
1)單個最好的加起來未必是最好的(ft,這早不是新東西了)
2)curse of dimensionality不像說的那么厲害
實際上很多特征是redundant的,所以可以通過尋找intrinsic feature 來實現(xiàn)
然后舉了幾個example,基本上是圖像處理方面的例子
一個是,asymmetry face identification,就是心理學(xué)家發(fā)現(xiàn)人在識別人臉的時候
不對稱特征很重要,所以她們也用不對稱性來identify 人臉
在feature extraction from raw data 后,發(fā)現(xiàn)用feature selection
可以降維并提高識別率
另一個例子是人腦三維圖像
還有一個是癌細(xì)胞identification
然后對特征選擇展望,說她們要做
1)unsupervise data的feature selection
1)unsupervise data的feature selection
2)試圖找到一個algorithm來尋找intrinsic features
不知道偶概括是否適當(dāng)
偶失望的是,她對已有feature selection批判一通,可結(jié)果用的方法還是information
Gain 和sequential forward search ,沒有新東西
發(fā)信人: took (逝者如斯...), 信區(qū): AI
標(biāo) 題: Re: 有沒有人去聽今天那個feature selection的講座
發(fā)信站: BBS 水木清華站 (Fri Nov 29 20:07:15 2002), 站內(nèi)
根據(jù)丑小鴨定理,feature的選定與分類目的相關(guān),這如何做到unsupervise呢?
丑小鴨定理的主要內(nèi)容是:丑小鴨與天鵝之間的差別與兩只天鵝之間的差別一樣大,
世界上所有事物之間的相似程度都是一樣的。從這條定理可以得到的一個推論是,不
存在摯靠凸蹟?shù)姆诸悩?biāo)準(zhǔn),人進(jìn)行分類所依據(jù)的一切準(zhǔn)則都是主觀的,選擇什么準(zhǔn)則
進(jìn)行分類則純屬主觀評價問題,是一個涉及到價值觀的問題。
發(fā)信人: spleen (觀察 決斷 行動), 信區(qū): AI
標(biāo) 題: Re: 有沒有人去聽今天那個feature selection的講座
發(fā)信站: BBS 水木清華站 (Fri Nov 29 21:31:52 2002), 站內(nèi)
比如說,你能不能認(rèn)為天鵝和鴨子的叫聲的區(qū)別,和天鵝的叫聲與機器轟鳴聲
的區(qū)別一樣大?
人們在日常生活中是否會作出這樣的判斷?
顯然不會,那么在這些判斷后面,是什么底層的感知機制在起作用?
發(fā)信人: xinjian (新兒~~勇于承認(rèn)自己的無知~~方能無畏), 信區(qū): AI
標(biāo) 題: Re: 有沒有人去聽今天那個feature selection的講座
發(fā)信站: BBS 水木清華站 (Fri Nov 29 21:40:08 2002), 站內(nèi)
unsupervise data本來做什么都不容易的
我所讀文獻(xiàn)中進(jìn)行unsupervise不過是將criterion變?yōu)檫m合
unsupervise數(shù)據(jù)的,比如聚類里邊的類內(nèi)距離,類間距離
總之,我對此非常懷疑,連個評價標(biāo)準(zhǔn)都不好找,那怎么說聚類好壞
乃至特征選擇的好壞呢
發(fā)信人: took (逝者如斯...), 信區(qū): AI
標(biāo) 題: Re: 有沒有人去聽今天那個feature selection的講座
發(fā)信站: BBS 水木清華站 (Sat Nov 30 16:58:46 2002), 站內(nèi)
關(guān)于丑小鴨定理我也沒有深入的理解:)
可以據(jù)這樣的例子:手寫字的識別字和識別寫字者,所需的特征應(yīng)該是不一樣的吧
所以unsupervise是否可以認(rèn)為在已有經(jīng)驗的基礎(chǔ)上對提取特征已經(jīng)有了偏好?
發(fā)信人: happyli (happyli), 信區(qū): AI
標(biāo) 題: Re: 有沒有人去聽今天那個feature selection的講座
發(fā)信站: BBS 水木清華站 (Sat Nov 30 20:28:54 2002), 站內(nèi)
我是這么理解的
就象人聽不到蝙蝠發(fā)出的聲音,,因為他沒有這種器官,一個事物的這個特征對于他來說就
是沒有的.也象牛看不到顏色一樣,每個個體都有自己的選擇,每個個體由于自身的不同而
把事物分成很多類別,也就是說一個事物有很多特征,(無窮的) 具體選用什么特征就是
主體的事情.就象一個沒有聽力的人,聲音這個維度是沒有的.
發(fā)信人: xinjian (新兒~~勇于承認(rèn)自己的無知~~方能無畏), 信區(qū): AI
標(biāo) 題: Re: 有沒有人去聽今天那個feature selection的講座
發(fā)信站: BBS 水木清華站 (Sun Dec 1 16:07:12 2002), 站內(nèi)
sure,我們想知道主體是怎么能一下子抓住對某件事情關(guān)鍵的特征的
haha,透過現(xiàn)象看本質(zhì),抓住主要矛盾,以及矛盾的主要方面
去偽存真,去粗取精 ,
這些能力,人也是要學(xué)習(xí)的,人是怎么變得越來越聰明的呢?
大腦這個存儲器官和分析器官簡直太優(yōu)越了
--
*** 端莊厚重 謙卑含容 事有歸著 心存濟物 ***
數(shù)據(jù)挖掘 http://DataMining@bbs.nju.edu.cn/
※ 來源:.南京大學(xué)小百合站 bbs.nju.edu.cn.[FROM: 211.80.38.17]
?? 快捷鍵說明
復(fù)制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -