?? 81.txt
字號:
發信人: Chipmunk (花栗鼠無語中), 信區: DataMining
標 題: Re: LSI(潛在語義索引)到底是什么?
發信站: 南京大學小百合站 (Fri Apr 11 21:07:29 2003)
LSI是PCA(Primary Component Analysis)用在文本處理上,目的還是降維,
和向量空間模型、概率模型不是一個層次上的事物。
在IR里,可以先用LSI將query和document投影到低維空間,然后再計算它們
之間的距離(采用向量空間模型)。
使用LSI的潛在目的是將Co-occurring terms in the same document more often
than chance投影到同樣的維上。
(請大家指正!)
【 在 supermoon (supermoon) 的大作中提到: 】
: 我看到有人說LSI是一種索引技術和倒排索引等一起并列;
: 也有人說LSI是特征選擇的一種方法,還有人說LSI是特征重構的方法,
: 是特征選擇的后一步工作;更有人說LSI是一種文本模型,和向量空間模型,
: 概率模型并列。到底LSI是什么?我真的胡涂了,求教各位大俠了。
--
有人說
歡樂總是很短
寂寞總是很長
讓自己 在
歡樂的日子里歡樂
寂寞的日子里堅強
※ 來源:.南京大學小百合站 bbs.nju.edu.cn.[FROM: 207.46.71.12]
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -