?? 1.txt
字號:
1.先說學習方法,我覺得Tom的ps做的挺好,要點都已經寫好了,所以最好先看ps,然后
看書,這樣有個提綱在自己心里,看的容易明白些。最后每章書上有個總結,也能把
要點列出,這一章看了什么,懂了什么,什么沒有懂,比較明白。
2.這一討論節,主要象ps中講了四個問題:
why,what,example,questions(以后要講的東西)
我覺得這一章是要讀的,因為它給了一個機器學習的框架。
3。關于why-helloboy已經總結過了,我只作一點感想。
本來我還在想在這個板開展機器學習的討論,是否不太務正業,搶了人家(AI)的
生意,看來這個討論就應該在我們板搞,因為ML跟AI有關系,但是第一大用戶是
數據挖掘的人,所以搞DM的同仁不管是做規則提取還是神經網絡還是聚類分析,
都had better讀讀這本書,參加討論。不要事不關己,高高掛起。
4.關于what,什么是機器學習,就這個概念來說,Tom的定義是最權威的,很多論文講
機器學習都要說我的定義是遵循Tom的,所以一定要理解掌握吧,以后看論文省力。
我做神經網絡多一些,看到好的論文,一般都要首先定義問題是什么(任務T),采用
什么樣的評價標準(性能標準P),比如有預測值跟實際值之間的RMSE、MAE、COE等等
in regression problems,對于分類問題,有RECALL,accuracy等。大作光這個能寫
上two pages。對于訓練經驗E,要么是標準測試樣本集,要么是自己做的,也要詳細
介紹的。
5.通過一個example介紹了西洋棋的學習問題。可能有的人(我)覺得羅嗦,我仔細想想
主要是我以前作的問題,很多步驟,缺省用的別人的東西,所以我自己都沒有想過
這些問題,很重要,比如為什么用到我的樓上一文中的10foldCV,因為要保證1.2.1中
的第三條,訓練樣本的分布要較好的表示實際樣本的分布。
最后得到四個核心環節的一個學習程序。這四個部分也很關鍵。
在我做的特征選擇問題中,也是要分為四部分,特征生成,特征訓練,子集驗證,
子集的使用。大家也可以把自己的問題往上套。
6.關于ML的問題,我想Tom是為了告訴大家以后學習的內容吧,以后我們再討論。
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -