整個實驗是在Windows環(huán)境下使用delphi完成的。選取了600篇文檔,數(shù)據(jù)集共分教育,商業(yè)與經(jīng)濟,計算機與因特網(wǎng),娛樂與休閑,自然科學(xué)5個類別,
教育類包括31篇文檔,
商業(yè)與經(jīng)濟類有93篇文檔,
計算機與因特網(wǎng)102篇文檔,
娛樂與休閑166篇文檔,
自然科學(xué)有208篇文檔。
目錄“DataSet”:RawText中的文本分詞后保存在DataSet目錄。
數(shù)據(jù)表“WordsTable”:保存DataSet中所有文本的倒排文檔。
其中“目錄DataSet”和“DataBase.mdb”為實驗測試所必須
標(biāo)簽:
Windows
delphi
600
實驗
上傳時間:
2014-01-11
上傳用戶:gdgzhym