?? 12.txt
字號:
發信人: GzLi (笑梨), 信區: DataMining
標 題: [合集]請大家指教,多謝
發信站: 南京大學小百合站 (Wed Sep 11 12:43:06 2002), 站內信件
BraveBaby (勇敢寶貝) 于Thu Sep 5 10:38:53 2002提到:
我是管理方面的,做的論文是移動通信運營業中數據挖掘的應用。
我接觸數據挖掘不久,只有二個月,但是論文要求10月份就做
出來了。現在我對數據挖掘還只是停留在很表面上的認識。不過,
這與我們的方向也有關,畢竟是管理方面的嘛(自我安慰)。
我現在論文做了一半了,到了算法與模型的階段了。現在我有些不
懂與不明白的地方了,特意請教一下各位高人:
1.我對算法還是不太明白,大家在版面上討論的一些算法方面的,我
都看不太懂。請問各位,象我這樣的論文,算法與模型應該怎么做
啊?是自己結合行業特點設計與創造一個呢,還是那樣算法是通用
的,只要用數據來訓練一下,然后改進一下參數就可以,還是其他。
2.這些算法,你們所說的什么原碼好象是有得下的吧,但是下來
以后,怎么用呢?要安裝什么軟件嗎?
目前就想到這些了,請大家多多賜教吧。我現在為論文郁悶死了。
多謝了。bow.
GzLi (笑梨) 于Thu Sep 5 12:56:59 2002提到:
碩士是嗎?
1)把數據整理好,
2)找個軟件,不如sas,比如matlab,或其它你手頭有,或你周圍人熟悉的
3)處理一下,看看能否用管理學的內容解釋一下。能解釋通了,
4)ok
你畢業吧。
sinokdd (KDD in China) 于Fri Sep 6 08:25:46 2002)
提到:
1.算法是通用的,只要用數據來訓練一下,然后改進一下參數就可以。
2. most source code systems are for linux, you can read
Readme file in the package. It will tell you how to make it.
I think the most difficult is how to identify the learning problem
in your case, that is, what kind of pattern you want to find.
And also
how to convert the original data to the training data, and how to
evaluate the result.
BraveBaby (勇敢寶貝) 于Fri Sep 6 12:58:28 2002提到:
多謝你的提示,能問一下,如果我有了數據后,
哪里能找到這些算法呢來訓練從而改進參數呢?
我的設想數據集里至少要包含以下這些數據:
用戶的基本情況數據,通話記錄數據,交費記錄數據。其他再根據
情況增減一些相關數據,如外部數據,投訴數據等等,大家認為
如何?
現在我一個很大的問題就是數據的收集,目前還沒有任何數據。郁悶。
希望下次去哪個移動公司調研的時候,能發發善心給我提供相關的
數據。
各位大俠,你們認為多少數據量是必需與足夠的呢?
1000個用戶的半年的通話記錄你們認為夠了嗎?
sinokdd (KDD in China) 于Fri Sep 6 14:07:55 2002)
提到:
www.kdnuggets.com
我認為你一開始至少應該有部分數據,并且假設你有了足夠的數據,你究竟
想從中找出什么來呢?我覺得這是最主要的,否則你也不知道那個
算法合適,并且你也無從知道該搜集哪些數據。
enough
BraveBaby (勇敢寶貝) 于Sat Sep 7 00:19:32 2002提到:
多謝你的幫助。我現在就在想辦法搞到數據。沒有數據,真是
太郁悶了。
不好意思,沒有經過你的允許,我就已經把大俠加為好友了。
以后,我可能還多多次向你請教,請多多指教啊。
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -