?? 782.txt
字號:
發信人: soullion (river), 信區: DataMining
標 題: 中醫方劑信息解析方案的提出和數據倉庫技術
發信站: 南京大學小百合站 (Fri Mar 1 13:52:11 2002)
項目的沿革與資源儲備
中醫藥資源開發項目從1985年6月開始規劃,開發工程從方劑庫開始,1986-1992年,歷時
六年,收集整理中醫方劑40萬張,覆蓋從漢朝到清朝的全部主要方書,涉及350多種中醫古
籍,并對其全文進行解析。1995年將公元960以前的在中國大陸的全部方劑信息進行實驗建
庫,并通過中醫管理局的技術鑒定,評價為“國內領先水平”。1997年,以“Web + DB +
Internet”的技術捆綁將方劑庫移植到ORACLE FOR UNIX平臺上,實現了國際范圍的網上
查詢和分析處理。目前正在進行方劑庫、中醫理論庫、中藥庫、針灸庫、各家醫案庫、現
代文獻提要庫、專題研究庫、中醫藥翻譯資源庫和中醫書籍庫的全面建設。
由于資源媒體和內容的不同,有相當一部分資源涉及多媒體技術,為了資源的合理管理和
利用的效率,我們在SQL Server For NT平臺上進行開發,目前我們正在進行中醫藥各學科
資源庫、中醫辨證施治模擬系統、特色醫療技術資源庫、遠程中醫處方分析處理及反饋系
統、專家經驗資源庫和中醫VOD資源庫的開發。
以上15種資源庫預計在一年之內有60%的資源庫可以進入正常的擴建維護之中,在此期間將
逐步地和用戶實現資源共享。
科學性回顧與技術跟蹤
1.中醫方劑信息解析方案的提出和數據倉庫技術
1985年,北京中醫藥大學和中國中醫研究院部分專家,共同討論提出了“中醫方劑信息解
析方案”,設計出“中醫方劑解析整理工作單”,并逐步完善了兩萬多字的工作單制作細
則,同時要求數據庫的設計要適應工作單的目標。該方案體現的思想與今數據倉庫技術設
計思想相和,而該方案的實踐距今已有十余年的歷史。
90年代后期,數據倉庫技術作為第二代業務信息系統(第一代為基于主機的查詢和報告)
被提出,它在信息處理的能力上有了巨大的飛躍,它最大的優勢是能提供歷史數據和匯總
信息,它以用戶可以理解的形式提供信息支持。數據倉庫技術的具體職能,就是將數據庫
的數據轉變成信息,提供多維分析和智能處理的基礎,于是數據庫與數據倉庫就有了明顯
的區別。
今天呈現在用戶面前的中醫藥信息是按照數據倉庫對信息處理的方案進行的,由于中醫文
獻的特點,目前還沒有能將如此復雜的文獻自動解析的軟件工具。就方劑庫而言,我們花
費了6年的時間,對40萬張方劑進行了解析,獲得約計800余萬條信息,如果將這些信息進
行綜合處理和調用,其信息量將難以想見。方劑如此何況其它。
2.統計分析功能的實現和OLAP技術
在資源庫中由于對數據實現了主題解析與合理存放,加上各種信息標引的實現,使系統具
有了統計分析的功能,而且這種統計分析功能是面對某一主題的多維分析。
OLAP(On-line Analytical Processing)是應用戶面對反饋信息需迅速做出決策而出現的
一種多維的分析技術,我們使用的分析方法接近OLAP的分析模式,大體分作兩個階段:19
95年以前,系統中的多維分析還沒有作到“維”項之間的邏輯關系,多維分析是平面的結
構;之后系統將接受OLAP技術立體的分析技術,逐漸在維象之間建立起相關性的分析,而
且可以作切片并能旋轉。
3.分析結果與數據挖掘
數據挖掘是個過程,是從大型數據庫中抽取以前沒有發現的、可理解的、可操作的信息來
支持人們的決策。簡單地說數據挖掘能幫助最終用戶回答“為什么”的問題,而使用戶知
道該“怎樣做”,這就是數據挖掘的意義,無疑這種技術在中醫藥信息系統中尤為重要,
我們所做的一切努力,都是為了取得這樣的一個效果。
從現有的分析結果顯示出:有些是以前我們沒有認識到的信息,這些信息和某些專家的臨
床經驗吻合,有的則能有效的指導臨床實踐。現用到的分析技術有分組、分類、數值預測
、關聯發現、順序規律發現等。
未來的規劃與發展趨勢
建立在基礎數據倉庫之上的專題分析模型將是資源發掘工程的主要任務,也是數據庫智能
化的高層表現形式,它是數據在數據倉庫技術的幫助下轉化為信息后,再由分析技術進行
信息挖掘,形成對某一個層面(專題)的綜合的分析,產生知識性的認識,也稱為第二性
的信息,并就這些信息之間的關聯進行深層的推理后,建立起知識化和宏觀量化相結合的
分析模型,用以完成一個中醫智能解決方案,使系統發揮出前所未有的信息穿透力,有力
地推動中醫事業現代化的步伐。
結語
中醫藥信息資源開發工程對中醫藥信息的收集、整理、綜合、分析提出了全新的概念和方
法。對古文獻采取全文收錄,現代文獻給出結構式摘要的文獻整理方法;首次提出了中醫
藥文獻的解析規則與實施方案;率先提出了適用于中醫藥古文獻的標引原則與標引方法,
并付諸實施;首次將數據倉庫的概念與技術引入中醫藥信息的分析處理中,逐步實現對中
醫藥信息的統計分析及知識挖掘;對于信息的發布,通過INTERNET進行,支持目前最流行
的WEB瀏覽器對數據庫的訪問。
中醫藥信息資源開發工程以綜合地繼承創新地發揚中醫藥學術為宗旨,建立在系統工程設
計的基礎上,有逐步增容和功能拓展的遠期規劃,并將與數據庫等信息科學的前沿技術同
步發展。
鑒于中醫藥信息資源開發是一個龐大的工程,我們希望能有更多的合作者介入,以共同完
成此業,為國家、民族,以及全人類獻上一份厚禮。
--
※ 來源:.南京大學小百合站 http://bbs.nju.edu.cn [FROM: 202.112.59.146]
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -