?? ml.htm
字號:
<!ArtChnTitle>
<!ArtChnAuthor>
<!ArtAuthorAddress>
<!ArtChnAbstract>
<!ArtChnKeyword>
<!ArtEngTitle>
<!ArtEngAuthor>
<!ArtEngAbstract>
<!ArtEngKeyword>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
<meta name="GENERATOR" content="Microsoft FrontPage 5.0">
<title>學位論文-K-means聚類算法的研究</title>
<style>A:link {COLOR: #000000; FONT-FAMILY: 宋體; TEXT-DECORATION: none}
A:visited {COLOR: #000000; FONT-FAMILY: 宋體; TEXT-DECORATION: none}
A:active {FONT-FAMILY:宋體; TEXT-DECORATION: none}
A:hover {COLOR: #000000;TEXT-DECORATION:none}
BODY {FONT-FAMILY:宋體; FONT-SIZE: 9pt;TEXT-DECORATION:none}
TABLE {FONT-FAMILY: 宋體; FONT-SIZE: 9pt}
.H1 {FONT-SIZE: 9pt; COLOR: #0000cc}
.ourfont {FONT-SIZE: 9pt; LINE-HEIGHT: 14pt}
select {font-size:12px;}
.wx {BACKGROUND: #001863; BORDER-BOTTOM: white 1px solid; BORDER-LEFT: white 1px solid; BORDER-RIGHT: white 1px solid; BORDER-TOP: white 1px solid; COLOR: #ffffff; FONT-SIZE: 9pt; FONT-STYLE: normal; FONT-VARIANT: normal; FONT-WEIGHT: normal; HEIGHT: 18px; LINE-HEIGHT: normal}
.wx1 {border-top: #c0c0c0 1px;border-left: #c0c0c0 1px;border-right:#c0c0c0 1px;border-bottom:#c0c0c0 1px;border-style:inset;background-color:#ffffff;vertical-align:text-bottom}
</style>
</head>
<body bgcolor="#FFFFFF" link="#000000" background="../image/bg.gif">
<img src="../../images/xwlwk.jpg" width="750" height="94">
<table width="83%" border="0" cellspacing="0" cellpadding="0">
<tr>
<td width="19%"><p> </p>
<p></p></td>
<td width="81%"><p>館藏號:Y1226557<br>
<br>
論 文 題 目:<strong style="font-weight: 400">K-means聚類算法的研究</strong><br>
學位授予單位:大連理工大學<br>
作 者:馮超<br>
申請學位級別:碩士<br>
學 科 名 稱:軟件工程<br>
指 導 教 師:吳國偉<br>
出 版 時 間:20071215<br>
摘 要:<br>
聚類是數據挖掘領域中重要的技術之一,用于發現數據中未知的分類。聚類分析已經有了很長的研究歷史,其重要性已經越來越受到人們的肯定。聚類算法是機器學習、數據挖掘和模式識別等研究方向的重要研究內容之一,在識別數據對象的內在關系方面,具有極其重要的作用。聚類主要應用于模式識別中的語音識別、字符識別等,機器學習中的聚類算法應用于圖像分割,圖像處理中,主要用于數據壓縮、信息檢索。聚類的另一個主要應用是數據挖掘、時空數據庫應用、序列和異常數據分析等。此外,聚類還應用于統計科學,同時,在生物學、地質學、地理學以及市場營銷等方面也有著重要的作用。<br> 本文是對聚類算法K-means的研究。首先介紹了聚類技術的相關概念。其次重點對K-means算法進行了分析研究,K-means算法是一種基于劃分的方法,該算法的優點是簡單易行,時間復雜度為O(n),并且適用于處理大規模數據。但是該算法存在以下缺點:需要給定初始的聚類個數K以及K個聚類中心,算法對初始聚類中心點的選擇很敏感,容易陷入局部最優,并且一般只能發現球狀簇。本文針對聚類個數K的確定、初始K個聚類中心的選定作了改進,給出了改進的算法MMDBK(Max-Min and Davies-BouldinIndexbased K-means,簡稱MMDBK)。算法的出發點是確保發現聚類中心的同時使同一類內的相似度大,而不同類之間的相似度小。算法采用Davies-Bouldin Index聚類指標確定最佳聚類個數,改進的最大最小距離法選取新的聚類中心,以及聚類中心的近鄰查找法來保證各個類之間的較小的相似度。文中最后使用KDD99數據集作為實驗數據,對K-means算法以及MMDBK算法進行了仿真實驗。結果顯示改進后的MMDBK算法在入侵檢測中是有效的。<br> <br>
分 類 號:TP311.13;TP301.6<br>
關 鍵 詞:數據挖掘;聚類分析;K-means;入侵檢測
<p align="center">
<table width="80" border="0" cellspacing="0" cellpadding="0">
<tr>
<td bgcolor="#cccccc">
<table width="100%" border="0" cellspacing="1" cellpadding="0">
<tr style="CURSOR: hand">
<td bgcolor="#CCCCCC" onMouseOver="this.bgColor='#999999';" onMouseOut="this.bgColor='#cccccc';" valign="bottom" height="18" NAME="NAME_BALL" STYLE="cursor:hand" child="FALL"><div align="center"><strong><font size="4"><a href="index.htm">PDF正文</a></font></strong></div></td>
</tr>
</table></td>
</tr>
</table>
</td>
</tr>
</table>
<div align="center"></div>
</body>
</html>
?? 快捷鍵說明
復制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號
Ctrl + =
減小字號
Ctrl + -