新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > 嵌入式數(shù)據(jù)挖掘模型及其在銀行卡業(yè)務(wù)中的應(yīng)用

嵌入式數(shù)據(jù)挖掘模型及其在銀行卡業(yè)務(wù)中的應(yīng)用

作者：時(shí)間：2013-11-21 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

2嵌入式數(shù)據(jù)挖據(jù)的應(yīng)用

2.1嵌入式 數(shù)據(jù)挖掘

在銀行卡業(yè)務(wù)中的應(yīng)用目前的數(shù)據(jù)挖掘技術(shù)在銀行卡業(yè)務(wù)上的應(yīng)用大多存在3個(gè)方面的局限：1）效率不高：面對(duì)目前的海量數(shù)據(jù)挖掘時(shí)，顯得無能為力；2）專業(yè)化程度較低：不能很好的專門針對(duì)銀行卡業(yè)務(wù)進(jìn)行挖掘；3）開銷較大：需要開發(fā)專門的系統(tǒng)來進(jìn)行數(shù)據(jù)挖掘，而且大多數(shù)系統(tǒng)不能進(jìn)行二次開發(fā)。

嵌入式數(shù)據(jù)挖掘顯然很好的彌補(bǔ)了普通數(shù)據(jù)挖掘技術(shù)所帶來的缺陷。首先，嵌入式數(shù)據(jù)挖據(jù)是把算法直接嵌入到數(shù)據(jù)倉庫下，從而減少數(shù)據(jù)轉(zhuǎn)換的時(shí)間，充分利用整個(gè)數(shù)據(jù)倉庫的處理能力，大大提高數(shù)據(jù)挖掘的效率；其次，它實(shí)現(xiàn)了算法的組件化管理，針對(duì)不同的行業(yè)開發(fā)不同的算法組件，對(duì)銀行卡業(yè)務(wù)進(jìn)行數(shù)據(jù)挖掘的主要目的是對(duì)客戶進(jìn)行分類，從中發(fā)現(xiàn)對(duì)銀行貢獻(xiàn)度較大的優(yōu)質(zhì)客戶，嵌入式數(shù)據(jù)挖掘可以開發(fā)單獨(dú)的算法專門滿足客戶分類的需要，從而具備了很好的專業(yè)性。最后，嵌入式數(shù)據(jù)挖掘系統(tǒng)是個(gè)種很靈活的數(shù)據(jù)挖掘系統(tǒng)，客戶可以在系統(tǒng)中不斷添加新的算法、改進(jìn)算法，同時(shí)進(jìn)行二次開發(fā)，從而省去了重新開發(fā)大型系統(tǒng)的開支，這點(diǎn)對(duì)于當(dāng)今企業(yè)來說顯得尤為重要。

2.2應(yīng)用實(shí)例分析

為了證實(shí)嵌入式數(shù)據(jù)挖掘模型的有效性，我們與中國銀行湖南分行進(jìn)行了合作，采用其信用卡業(yè)務(wù)數(shù)據(jù)分別對(duì)嵌入式數(shù)據(jù)挖掘模型系統(tǒng)和非嵌入式數(shù)據(jù)挖掘模型系進(jìn)行運(yùn)行對(duì)比，測(cè)試是在PC機(jī)（P4 2.5G CPU，HY DDR512M RAM）上進(jìn)行的，選取CMP和Apriori兩種數(shù)據(jù)挖掘算法。選擇嵌入的數(shù)據(jù)庫為SQL Server 2005實(shí)驗(yàn)錢據(jù)從10 000條記錄到160 000條記錄，以測(cè)試上述兩種算法在大小不同數(shù)據(jù)集上采用嵌入式數(shù)據(jù)挖掘和非嵌入式數(shù)據(jù)挖掘所表現(xiàn)出的性能差異。嵌入式數(shù)據(jù)挖掘在銀行卡業(yè)務(wù)中的應(yīng)用主要包括關(guān)聯(lián)規(guī)則挖掘和分類挖掘。

1）關(guān)聯(lián)規(guī)則挖掘綜合持卡人用卡行為和基本情況進(jìn)行分析，導(dǎo)出具有一定支持度和可信度的用卡習(xí)慣的人群組成之間的關(guān)聯(lián)規(guī)則。在算法選擇方面，選擇了由wang H等提出的一種新型高效決策數(shù)算法：CMP算法。在實(shí)例中，當(dāng)實(shí)例數(shù)據(jù)呈倍數(shù)增長時(shí)，數(shù)據(jù)挖掘所需時(shí)間對(duì)比如表1所示。

算法運(yùn)行效率曲線如圖5所示。

本文引用地址：http://www.104case.com/article/257004.htm

2）分類挖掘根據(jù)持卡人的使用情況和交易方式，對(duì)持卡人群進(jìn)行分類，主要分為優(yōu)質(zhì)客戶、潛在優(yōu)質(zhì)客戶、流失客戶和潛在流失客戶等，這也是當(dāng)前比較流行的用法。在分類挖掘過程中，使用關(guān)聯(lián)規(guī)則中的Apriori算法對(duì)實(shí)例進(jìn)行了數(shù)據(jù)的挖掘，算法時(shí)間對(duì)比如表2所示。

算法運(yùn)行效率曲線如圖6所示。

從以上對(duì)比數(shù)據(jù)可以看出，在將嵌入式數(shù)據(jù)挖掘應(yīng)用到銀行卡業(yè)務(wù)數(shù)據(jù)的挖掘當(dāng)中后，對(duì)于兩種不同的算法，其效率的提高都是顯而易見的，從圖形中可以看出，不管是CMP還是Apriori，其效率上都有2～3倍的提高。從應(yīng)用實(shí)例中，還可以看出，隨著業(yè)務(wù)數(shù)據(jù)量的不斷加大，嵌入式數(shù)據(jù)挖掘能更進(jìn)一步的節(jié)省時(shí)間。整體說來，嵌入式數(shù)據(jù)挖掘模型是非常有效的，同時(shí)把它應(yīng)用于銀行卡業(yè)務(wù)數(shù)據(jù)的挖掘中也是切實(shí)可行的。

3結(jié)束語

嵌入式數(shù)據(jù)挖掘模型使挖掘算法更加簡單易用、方便，它將成為第四代數(shù)據(jù)挖掘系統(tǒng)的一個(gè)重要發(fā)展方向之一，也是數(shù)據(jù)倉庫系統(tǒng)，商業(yè)智能平臺(tái)的一個(gè)重要發(fā)展方向。把新的嵌入式數(shù)據(jù)挖掘技術(shù)應(yīng)用到銀行卡業(yè)務(wù)中，一方面可以驗(yàn)證嵌入式數(shù)據(jù)挖掘技術(shù)的優(yōu)越性，推動(dòng)數(shù)據(jù)挖掘技術(shù)的發(fā)展；另一方面，為商務(wù)智能應(yīng)用軟件升級(jí)做出貢獻(xiàn)，這是一個(gè)極具吸引力的課題，具有十分重要的社會(huì)效益和經(jīng)濟(jì)價(jià)值。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解（linux不再難懂）

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關(guān)鍵詞： 嵌入式 數(shù)據(jù)挖掘 銀行卡 算法嵌入層

新聞中心

嵌入式數(shù)據(jù)挖掘模型及其在銀行卡業(yè)務(wù)中的應(yīng)用

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)