?? 6.txt
字號:
發(fā)信人: jiyun512 (allen), 信區(qū): DataMining
標 題: 原創(chuàng)-文檔數(shù)據(jù)庫可實現(xiàn)性分析報告
發(fā)信站: 南京大學小百合站 (Wed May 21 18:27:44 2003)
文檔數(shù)據(jù)庫可實現(xiàn)性分析報告
一、背景分析:
傳統(tǒng)的關(guān)系型數(shù)據(jù)軟件有著有限的數(shù)據(jù)類型,對多媒體數(shù)據(jù)的支持不夠,現(xiàn)有的,像
InterBase,SQL Server,DB2大型數(shù)據(jù)庫軟件,對圖像的處理也僅限于二進制的處理,在用
戶終端的處理中,要用到像PHP,ASP,JSP等這樣的腳本語言的支持,對終端數(shù)據(jù)的處理帶
來一定的不便,假設說你把整個頁面做為一個文檔而處理進數(shù)據(jù)庫,查訊的結(jié)果就是一個
即有文字,又有圖像的一個集合,由于它的基本單位為文檔類型的,所以稱之為文檔數(shù)據(jù)
庫。
二、文檔數(shù)據(jù)庫的現(xiàn)有產(chǎn)品
己經(jīng)市場化的產(chǎn)品是Lotus Notes的文檔數(shù)據(jù)庫,作為一種新型的數(shù)據(jù)庫,其的應用正
在擴大。
三、可行性分析:
(一)、算法問題:
搜索算法:可以借用GOOGLE的算法,它在互聯(lián)網(wǎng)上的文檔搜索己經(jīng)相當?shù)某墒欤?可以直接借用過來(關(guān)鍵字和PageRanker的結(jié)合)。
儲存算法:可以用B-Tree,如果有更好的算法也可。
(二)、底層的設計:
我們現(xiàn)在有的代碼是InterBase的FireBird(區(qū)別于Unix下的FireBird BBS)項目組
,它是一個小型的數(shù)據(jù)庫軟件,支持并發(fā)性操作,用的是C++,代碼也并是很龐大,大約
有2M多的源碼,我們可以借來它的一些底層的設計思想和方法,至于MYSQL源碼太大,有5
0M,所以分析起來也有一定的不便性。
我們要用它的設計思想設計出我們這個數(shù)據(jù)庫和傳統(tǒng)數(shù)據(jù)庫相兼容的一部分。
(三)、用戶界面的設計:
用戶界面的設計可以用QT來設計,一個跨平臺的C++設計器,用來作Windows和Li
nux下的C++程序設計,界面風格可以參考Accecc的設計風格,盡量使界面容易使用。
(四)、和其它數(shù)據(jù)庫的數(shù)據(jù)轉(zhuǎn)換:
內(nèi)部存儲用到的格式是XML,可以按一定的格式向外輸出,增強其對現(xiàn)有數(shù)據(jù)兼容性
,同時也提供一些數(shù)據(jù)文件格式的轉(zhuǎn)換工具,簡化我們的操作。
(五)、別外的一種設計思想:
這種設計思想就是把文檔作為一種數(shù)據(jù)庫的數(shù)據(jù)類型而存在,這樣設計的話,會更
多的加強數(shù)據(jù)庫的兼容性,和滿足DBA的使用習慣。
(六)、法律問題的解決:
這個數(shù)據(jù)庫的設計中大多地參考了別人的設計技術(shù),所以在這個過程中,其也是應
該注意的。
(七)、政府的強有力支持。
更多細節(jié)見:http://jiyun512.51.net/showinfo.php?type=1&id=169
設計人:王紀云(jiyun512@bbs.nju.edu.cn/0371-8336405/網(wǎng)絡一班)
--
jiyun512 vias
※ 來源:.南京大學小百合站 http://bbs.nju.edu.cn [FROM: 61.163.245.221]
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -