- 相關(guān)推薦
基于GP算法的知識發(fā)現(xiàn)系統(tǒng)
基于GP算法的知識發(fā)現(xiàn)系統(tǒng)
李亞非
(南京建筑工程學(xué)院計(jì)算中心,南京,210009)
摘 要 本文提出了一個(gè)新的知識發(fā)現(xiàn)系統(tǒng)。該系統(tǒng)以遺傳編程算法為核心,解決發(fā)現(xiàn)一組屬于面向?qū)ο髷?shù)據(jù)庫的對象所具有的共性問題。本文對系統(tǒng)作了扼要的說明,對GP算法進(jìn)行了描述,并給出了一個(gè)實(shí)驗(yàn)例子。
關(guān)鍵詞 進(jìn)化計(jì)算 遺傳編程 知識發(fā)掘
在數(shù)據(jù)庫中發(fā)現(xiàn)有用的知識是數(shù)據(jù)挖掘(Data Mining, DM)的主要任務(wù),在一定的情況下,所有的數(shù)據(jù)庫查詢可以認(rèn)為是完成這項(xiàng)任務(wù)。我們現(xiàn)在有一套分析和探索數(shù)據(jù)的工具:SQL查詢、OLAP和數(shù)據(jù)挖掘技術(shù)。SQL查詢由關(guān)系代數(shù)所構(gòu)成;OLAP提供了建立在多維數(shù)據(jù)模型基礎(chǔ)上的高水平查詢;而數(shù)據(jù)挖掘提供了最抽象的數(shù)據(jù)分析操作。我們可以認(rèn)為不同的數(shù)據(jù)挖掘任務(wù)是在高水平上的復(fù)雜查詢。數(shù)據(jù)挖掘是機(jī)器學(xué)習(xí)和數(shù)據(jù)庫技術(shù)的交叉學(xué)科,DM系統(tǒng)的主要特點(diǎn)是:在數(shù)據(jù)庫中發(fā)現(xiàn)能夠用某些規(guī)則表述的、隱含的知識;與數(shù)據(jù)庫是緊密集成的;高度自動(dòng)化的;對知識發(fā)現(xiàn)的處理是有效率的(尤其對大型數(shù)據(jù)庫)。
這里我們給出一種基于GP
(Genetic Programming,遺傳編程)算法的知識發(fā)現(xiàn)系統(tǒng),和通常對數(shù)據(jù)庫的查詢不同的是,這個(gè)系統(tǒng)可對特定的對象集產(chǎn)生特定的查詢集,系統(tǒng)自動(dòng)根據(jù)查詢集訪問數(shù)據(jù)庫,從而發(fā)掘出數(shù)據(jù)庫中隱含的知識。本文將對上述知識發(fā)掘過程進(jìn)行詳細(xì)描述,并提出了一種用遺傳編程(GP)來進(jìn)行數(shù)據(jù)挖掘的方法,GP個(gè)體由數(shù)據(jù)庫查詢組成,而這些查詢代表了高水平上的規(guī)則。
【基于GP算法的知識發(fā)現(xiàn)系統(tǒng)】相關(guān)文章:
基于Visual Basic快速開發(fā)現(xiàn)場電視監(jiān)控系統(tǒng)04-12
基于Client/Server 的課件系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)04-12
基于Internet的多媒體教學(xué)系統(tǒng)結(jié)構(gòu)08-17
基于Verilog HDL設(shè)計(jì)的自動(dòng)數(shù)據(jù)采集系統(tǒng)04-12
基于系統(tǒng)思維下的生態(tài)外語教學(xué)08-25
淺談基于數(shù)字星球系統(tǒng)的地理教學(xué)設(shè)計(jì)08-20