?? 2.txt
字號:
發信人: GzLi (笑梨), 信區: DataMining
標 題: [合集]有些迷惑
發信站: 南京大學小百合站 (Tue Jan 7 10:46:20 2003)
highso (漫步者) 于Sat Dec 28 20:22:17 2002)
提到:
看到斑竹在這里號召學習ML,很是心動,可是仔細想想,又有些迷茫,
ML現在搞的很多,似乎越來越成了數學家的游戲,理論越來越高深,
至于吾輩,恐怕還主要是作應用的,在ML應用于某個領域的結合點上,
始終是個難點,所以如果我去學ML的話,應該報著什么樣的態度去學習?
到底要搞的多深?我想了解大家學習這個的目的和深度,謝謝
GzLi (笑梨) 于Sat Dec 28 23:25:16 2002)
提到:
我是要作數據挖掘(DM)的,很多算法來自于機器學習(ML),所以我要學習ML。
深度本次就是把這本書學好。對ML有個整體了解,以后再分專題深入研究。
1.學習整體框架,這樣對于ML的數據本身、數據建模、模型評價、等有個了解
2.學習一些常用算法,對各鐘算法有個一定的了解,便于以后根據不通場合使用
3.學習一些基本知識,比如cross validation,boosting、bagging,有利于看論文。
馬克思(或者是列寧)有句話:理論指導實踐,但從實踐中提高,
現在ML指導DM,DM反過來促進ML提高的,ML很重要一點就是大規模數據的可視化、
建模等問題,來自DM吧。
所以要學好ML。
【 在 highso (漫步者) 的大作中提到: 】
: 看到斑竹在這里號召學習ML,很是心動,可是仔細想想,又有些迷茫,
: ML現在搞的很多,似乎越來越成了數學家的游戲,理論越來越高深,
: 至于吾輩,恐怕還主要是作應用的,在ML應用于某個領域的結合點上,
: 始終是個難點,所以如果我去學ML的話,應該報著什么樣的態度去學習?
: 到底要搞的多深?我想了解大家學習這個的目的和深度,謝謝
highso (漫步者) 于Sun Dec 29 10:17:44 2002)
提到:
多謝斑竹指點!我也知道ML的重要性,我是作入侵檢測的,大量的需要
ML,比方說我以前也用過SVM作過分類,離線分析的效果還可以,但是
真要涉及到具體實現,可以說基本不可行,SVM的學習速度,對樣本的要求,
原始數據的中訓練集和測試集的不相似性等等問題,導致了這種不可行
我覺得現在作ML的,大多是用標準的訓練集和測試集來作算法驗證,如UCL的
和實際的結合上差的太遠,但是還是象你說的,首先得把概念搞懂,然后
才能結合實際,但是在這個學習得過程中,好多東西,比方說很多數學上
得東西,大家覺得有必要吃得很透嗎?
【 在 GzLi (笑梨) 的大作中提到: 】
: 我是要作數據挖掘(DM)的,很多算法來自于機器學習(ML),所以我要學習ML。
: 深度本次就是把這本書學好。對ML有個整體了解,以后再分專題深入研究。
: 1.學習整體框架,這樣對于ML的數據本身、數據建模、模型評價、等有個了解
: 2.學習一些常用算法,對各鐘算法有個一定的了解,便于以后根據不通場合使用
: 3.學習一些基本知識,比如cross validation,boosting、bagging,有利于看論文。
: 馬克思(或者是列寧)有句話:理論指導實踐,但從實踐中提高,
: 現在ML指導DM,DM反過來促進ML提高的,ML很重要一點就是大規模數據的可視化、
: 建模等問題,來自DM吧。
: 所以要學好ML。
: 【 在 highso (漫步者) 的大作中提到: 】
GzLi (笑梨) 于Sun Dec 29 16:11:01 2002)
提到:
呵呵,
這本書都是基本概念和基本的推導阿,我覺得這本書的層次還是要吃透的吧。
實際數據和實驗數據差的遠,正是我們努力的動力,
找出原因,解決之,是我們的責任。
【 在 highso (漫步者) 的大作中提到: 】
: 多謝斑竹指點!我也知道ML的重要性,我是作入侵檢測的,大量的需要
: ML,比方說我以前也用過SVM作過分類,離線分析的效果還可以,但是
: 真要涉及到具體實現,可以說基本不可行,SVM的學習速度,對樣本的要求,
: 原始數據的中訓練集和測試集的不相似性等等問題,導致了這種不可行
: 我覺得現在作ML的,大多是用標準的訓練集和測試集來作算法驗證,如UCL的
: 和實際的結合上差的太遠,但是還是象你說的,首先得把概念搞懂,然后
: 才能結合實際,但是在這個學習得過程中,好多東西,比方說很多數學上
: 得東西,大家覺得有必要吃得很透嗎?
: 【 在 GzLi (笑梨) 的大作中提到: 】
daniel (飛翔鳥) 于Sun Dec 29 16:18:39 2002)
提到:
it should be noted that almost all UCI data sets are from real-world
applications. So, it is not the fact that they are 'far away' from
real world. Many methods can perform well on most of these data just
because these data sets are publicly availabe so that they have been
deeply investigated by researchers around the world.
【 在 highso (漫步者) 的大作中提到: 】
: 多謝斑竹指點!我也知道ML的重要性,我是作入侵檢測的,大量的需要
: ML,比方說我以前也用過SVM作過分類,離線分析的效果還可以,但是
: 真要涉及到具體實現,可以說基本不可行,SVM的學習速度,對樣本的要求,
: 原始數據的中訓練集和測試集的不相似性等等問題,導致了這種不可行
: 我覺得現在作ML的,大多是用標準的訓練集和測試集來作算法驗證,如UCL的
: 和實際的結合上差的太遠,但是還是象你說的,首先得把概念搞懂,然后
: 才能結合實際,但是在這個學習得過程中,好多東西,比方說很多數學上
: 得東西,大家覺得有必要吃得很透嗎?
: 【 在 GzLi (笑梨) 的大作中提到: 】
GzLi (笑梨) 于Sun Dec 29 18:09:50 2002)
提到:
really,
The results are not only depend on the algorithms you used, but also on
the preprocess and proprocess of the data and the usage of the algorithm.
tricks also in great need.
So I think a complete system of ML is to be grasped.
【 在 daniel (飛翔鳥) 的大作中提到: 】
: it should be noted that almost all UCI data sets are from real-world
: applications. So, it is not the fact that they are 'far away' from
: real world. Many methods can perform well on most of these data just
: because these data sets are publicly availabe so that they have been
: deeply investigated by researchers around the world.
: 【 在 highso (漫步者) 的大作中提到: 】
ihappy (hungry christmas) 于Sun Dec 29 23:53:01 2002)
提到:
hehe, from the perspective of data mining, such tricks are important.
but there is the NFL theorem. In fact, i think before study any specific
ML algorithm, NFL should be mentioned first.
【 在 GzLi (笑梨) 的大作中提到: 】
: really,
: The results are not only depend on the algorithms you used, but also on
: the preprocess and proprocess of the data and the usage of the algorithm.
: tricks also in great need.
: So I think a complete system of ML is to be grasped.
: 【 在 daniel (飛翔鳥) 的大作中提到: 】
adson (自強乃報國之本) 于Mon Dec 30 01:39:23 2002)
提到:
excuse me, what is NFL?
【 在 ihappy 的大作中提到: 】
: hehe, from the perspective of data mining, such tricks are important.
: but there is the NFL theorem. In fact, i think before study any specific
: ML algorithm, NFL should be mentioned first.
: 【 在 GzLi (笑梨) 的大作中提到: 】
ihappy (hungry christmas) 于Mon Dec 30 01:51:25 2002)
提到:
No Free Lunch 天下沒有免費的午餐.
前面guitar有一個貼子,里面有roweis的一個ppt的鏈接,好像里面nfl的部分寫的
還可以,可以去看看的
【 在 adson (自強乃報國之本) 的大作中提到: 】
: excuse me, what is NFL?
:
: 【 在 ihappy 的大作中提到: 】
adson (自強乃報國之本) 于Mon Dec 30 03:43:57 2002)
提到:
呵呵,多謝師兄指點。
我把guitar發過的所有文章都翻出來了,
可還是找不到那個鏈接......
那個ppt大致意思說得是什么?
【 在 ihappy 的大作中提到: 】
: No Free Lunch 天下沒有免費的午餐.
: 前面guitar有一個貼子,里面有roweis的一個ppt的鏈接,好像里面nfl的部分寫的
: 還可以,可以去看看的
: 【 在 adson (自強乃報國之本) 的大作中提到: 】
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -