主頁 > 知識庫 > 數(shù)據(jù)挖掘及其在商業(yè)銀行中的作用

數(shù)據(jù)挖掘及其在商業(yè)銀行中的作用

熱門標(biāo)簽:河北三河400電話的申請 福建辦理400電話的公司 宿遷自建外呼系統(tǒng) 鎮(zhèn)江地圖標(biāo)注app 山西云電銷機器人公司 給商家地圖標(biāo)注定位 百度地圖標(biāo)注位置多久顯示出來 天水電銷 小語語音電話機器人哪家好
  隨著互聯(lián)網(wǎng)的出現(xiàn),信息過量幾乎成為人人需要面對的問題。如何才能不被信息的汪洋大海所淹沒,從中及時發(fā)現(xiàn)有用的知識,提高信息利用率牽數(shù)據(jù)挖掘技術(shù)應(yīng)運而生,越來越顯示出其強大的生命力。金融事務(wù)需要搜集和處理大量的數(shù)據(jù),由于銀行在金融領(lǐng)域的地位、工作性質(zhì)、業(yè)務(wù)特點以及激烈的市場競爭決定了它對信息化、電子化比其它領(lǐng)域有更迫切的要求。利用數(shù)據(jù)挖掘技術(shù)可以幫助銀行產(chǎn)品開發(fā)部門描述客戶以往的需求趨勢,并預(yù)測未來。美國商業(yè)銀行是發(fā)達國家商業(yè)銀行的典范,許多地方值得我國學(xué)習(xí)和借鑒。

  一、數(shù)據(jù)挖掘的基本原理

  1.?dāng)?shù)據(jù)挖掘概述

  數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數(shù)據(jù)挖掘是一種從大型數(shù)據(jù)庫或數(shù)據(jù)倉庫中提取隱藏的預(yù)測性信息的新技術(shù)。它能開采出潛在的模式,找出最有價值的信息,指導(dǎo)商業(yè)行為或輔助科學(xué)研究。還有很多和數(shù)據(jù)挖掘這一術(shù)語相近的術(shù)語,如從數(shù)據(jù)庫中發(fā)現(xiàn)知識、數(shù)據(jù)分析、數(shù)據(jù)融合等。原始數(shù)據(jù)可以是結(jié)構(gòu)化的,如關(guān)系數(shù)據(jù)庫中的數(shù)據(jù),也可以是半結(jié)構(gòu)化的,如文本、圖形、圖像數(shù)據(jù),甚至是分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)。發(fā)現(xiàn)知識的方法可以是數(shù)學(xué)的,也可以是非數(shù)學(xué)的;可以是演繹的,也可以是歸納的。已有的知識可以被用于信息管理、查詢優(yōu)化、決策支持、過程控制等,還可以用于數(shù)據(jù)自身的維護。因此,數(shù)據(jù)挖掘是一門廣義的交叉學(xué)科,它匯聚了不同領(lǐng)域的研究者尤其是數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計、可視化、并行計算等方面的學(xué)者和工程技術(shù)人員。

  2.?dāng)?shù)據(jù)挖掘的流程

 ?。?)數(shù)據(jù)取樣。當(dāng)進行數(shù)據(jù)挖掘時,首先要從企業(yè)大量數(shù)據(jù)中取出一個與要搜索的問題相關(guān)的樣板數(shù)據(jù)子集,而不是動用全部企業(yè)數(shù)據(jù)。通過對數(shù)據(jù)樣本的精選,不僅能減少數(shù)據(jù)處理量,節(jié)省系統(tǒng)資源,而且能通過對數(shù)據(jù)的篩選,使數(shù)據(jù)更加具有規(guī)律性。

 ?。?)數(shù)據(jù)探索。數(shù)據(jù)探索就是通常所進行的對數(shù)據(jù)深入調(diào)查的過程,從樣本數(shù)據(jù)集中找出規(guī)律和趨勢,用聚類分析區(qū)分類別,最終要達到的目的就是搞清楚多因素相互影響的、十分復(fù)雜的關(guān)系,發(fā)現(xiàn)因素之間的相關(guān)性。

 ?。?)數(shù)據(jù)調(diào)整。通過上述兩個步驟的操作,對數(shù)據(jù)的狀態(tài)和趨勢有了進一步的了解,這時要盡可能對問題解決的要求能進一步明確化、進一步量化。針對問題的需求要對數(shù)據(jù)進行增刪,按照對整個數(shù)據(jù)挖掘過程的新認(rèn)識組合或生成一個新的變量,以體現(xiàn)對狀態(tài)的有效描述。

  (4)模型化。在問題進一步明確,數(shù)據(jù)結(jié)構(gòu)和內(nèi)容進一步調(diào)整的基礎(chǔ)上,就可以建立模型。這一步是數(shù)據(jù)挖掘的核心環(huán)節(jié),運用神經(jīng)網(wǎng)絡(luò)、決策樹、數(shù)理統(tǒng)計、時間序列分析等方法來建立模型。
 ?。?)評價。從上述過程中將會得出一系列的分析結(jié)果、模式和模型,多數(shù)情況會得出對目標(biāo)問題多側(cè)面的描述,這時就要綜合它們的規(guī)律性,提供合理的決策支持信息。評價的一種辦法是直接使用原先建立模型樣本和樣本數(shù)據(jù)來進行檢驗牷另一種辦法是另找一批數(shù)據(jù)并對其進行檢驗,已知這些數(shù)據(jù)能反映客觀實踐的規(guī)律性牷再一種辦法是在實際運行的環(huán)境中取出新鮮數(shù)據(jù)進行檢驗。

  以上敘述的是數(shù)據(jù)挖掘的基本流程如下圖所示。這一過程要反復(fù)進行牞在反復(fù)過程中,不斷地趨近事物的本質(zhì),不斷地優(yōu)先問題的解決方案。數(shù)據(jù)重組和細分添加和拆分記錄選取數(shù)據(jù)樣本可視化數(shù)據(jù)探索聚類分析神經(jīng)網(wǎng)絡(luò)、決策樹數(shù)理統(tǒng)計、時間序列結(jié)論綜合解釋評價數(shù)據(jù)知識數(shù)據(jù)取樣數(shù)據(jù)探索數(shù)據(jù)調(diào)整模型化評價。

  3.?dāng)?shù)據(jù)挖掘的功能

  數(shù)據(jù)挖掘通過預(yù)測未來趨勢及行為,做出前攝的、基于知識的決策。數(shù)據(jù)挖掘的目標(biāo)是從數(shù)據(jù)庫中發(fā)現(xiàn)隱含的、有意義的知識,主要有以下五類功能。

  (1)自動預(yù)測趨勢和行為。數(shù)據(jù)挖掘自動在大型數(shù)據(jù)庫中尋找預(yù)測性信息,以往需要進行大量手工分析的問題如今可以迅速直接由數(shù)據(jù)本身得出結(jié)論。一個典型的例子是市場預(yù)測問題,數(shù)據(jù)挖掘使用過去有關(guān)促銷的數(shù)據(jù)來尋找未來投資中回報最大的用戶,其它可預(yù)測的問題包括預(yù)報破產(chǎn)以及認(rèn)定對指定事件最可能作出反應(yīng)的群體。

 ?。?)關(guān)聯(lián)分析。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。若兩個或多個變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。有時并不知道數(shù)據(jù)庫中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也是不確定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。

 ?。?)聚類。數(shù)據(jù)庫中的記錄可被化分為一系列有意義的子集,即聚類。聚類增強了人們對客觀現(xiàn)實的認(rèn)識,是概念描述和偏差分析的先決條件。聚類技術(shù)主要包括傳統(tǒng)的模式識別方法和數(shù)學(xué)分類學(xué)。80年代初,Mchalski提出了概念聚類技術(shù)牞其要點是,在劃分對象時不僅考慮對象之間的距離,還要求劃分出的類具有某種內(nèi)涵描述,從而避免了傳統(tǒng)技術(shù)的某些片面性。

  (4)概念描述。概念描述就是對某類對象的內(nèi)涵進行描述,并概括這類對象的有關(guān)特征。概念描述分為特征性描述和區(qū)別性描述,前者描述某類對象的共同特征,后者描述不同類對象之間的區(qū)別。生成一個類的特征性描述只涉及該類對象中所有對象的共性。生成區(qū)別性描述的方法很多,如決策樹方法、遺傳算法等。

 ?。?)偏差檢測。數(shù)據(jù)庫中的數(shù)據(jù)常有一些異常記錄,從數(shù)據(jù)庫中檢測這些偏差很有意義。偏差包括很多潛在的知識,如分類中的反常實例、不滿足規(guī)則的特例、觀測結(jié)果與模型預(yù)測值的偏差、量值隨時間的變化等。偏差檢測的基本方法是,尋找觀測結(jié)果與參照值之間有意義的差別。

  二、數(shù)據(jù)挖掘工具

  1.基于神經(jīng)網(wǎng)絡(luò)的工具

  由于對非線性數(shù)據(jù)的快速建模能力,基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘工具現(xiàn)在越來越流行。其開采過程基本上是將數(shù)據(jù)聚類,然后分類計算權(quán)值。神經(jīng)網(wǎng)絡(luò)很適合非線性數(shù)據(jù)和含噪聲數(shù)據(jù),所以在市場數(shù)據(jù)庫的分析和建模方面應(yīng)用廣泛。

  2.基于規(guī)則和決策樹的工具

  大部分?jǐn)?shù)據(jù)挖掘工具采用規(guī)則發(fā)現(xiàn)或決策樹分類技術(shù)來發(fā)現(xiàn)數(shù)據(jù)模式和規(guī)則,其核心是某種歸納算法。這類工具通常是對數(shù)據(jù)庫的數(shù)據(jù)進行開采,生產(chǎn)規(guī)則和決策樹,然后對新數(shù)據(jù)進行分析和預(yù)測。這類工具的主要優(yōu)點是,規(guī)則和決策樹都是可讀的。

  3.基于模糊邏輯的工具

  其發(fā)現(xiàn)方法是應(yīng)用模糊邏輯進行數(shù)據(jù)查詢、排序等。該工具使用模糊概念和“最近”搜索技術(shù)的數(shù)據(jù)查詢工具,它可以讓用戶指定目標(biāo),然后對數(shù)據(jù)庫進行搜索,找出接近目標(biāo)的所有記錄,并對結(jié)果進行評估。

  4.綜合多方法工具

  不少數(shù)據(jù)挖掘工具采用了多種開采方法,這類工具一般規(guī)模較大,適于大型數(shù)據(jù)庫牗包括并行數(shù)據(jù)庫牘。這類工具開采能力很強,但價格昂貴,并要花很長時間進行學(xué)習(xí)。

  三、數(shù)據(jù)挖掘技術(shù)在商業(yè)銀行中的應(yīng)用

  數(shù)據(jù)挖掘技術(shù)在美國銀行金融領(lǐng)域應(yīng)用廣泛。金融事務(wù)需要搜集和處理大量數(shù)據(jù),對這些數(shù)據(jù)進行分析,發(fā)現(xiàn)其數(shù)據(jù)模式及特征,然后可能發(fā)現(xiàn)某個客戶、消費群體或組織的金融和商業(yè)興趣,并可觀察金融市場的變化趨勢。商業(yè)銀行業(yè)務(wù)的利潤和風(fēng)險是共存的。為了保證最大的利潤和最小的風(fēng)險,必須對帳戶進行科學(xué)的分析和歸類,并進行信用評估。Mellon銀行使用IntelligentAgent數(shù)據(jù)挖掘軟件提高銷售和定價金融產(chǎn)品的精確度,如家庭普通貸款。零售信貸客戶主要有兩類,一類很少使用信貸限額(低循環(huán)者),另一類能夠保持較高的未清余額(高循環(huán)者)。每一類都代表著銷售的挑戰(zhàn)。低循環(huán)者代表缺省和支出注銷費用的危險性較低,但會帶來極少的凈收入或負(fù)收入,因為他們的服務(wù)費用幾乎與高循環(huán)者的相同。銀行常常為他們提供項目,鼓勵他們更多地使用信貸限額或找到交叉銷售高利潤產(chǎn)品的機會。高循環(huán)者由高和中等危險元件構(gòu)成。高危險分段具有支付缺省和注銷費用的潛力。對于中等危險分段,銷售項目的重點是留住可獲利的客戶并爭取能帶來相同利潤的新客戶。但根據(jù)新觀點,用戶的行為會隨時間而變化。分析客戶整個生命周期的費用和收入就可以看出誰是最具創(chuàng)利潛能的。Mellon銀行認(rèn)為“根據(jù)市場的某一部分進行定制”能夠發(fā)現(xiàn)最終用戶并將市場定位于這些用戶。但是,要這么做就必須了解關(guān)于最終用戶特點的信息。數(shù)據(jù)挖掘工具為Mellon銀行提供了獲取此類信息的途徑。Mellon銀行銷售部在先期數(shù)據(jù)挖掘項目上使用IntelligenceAgent尋找信息,主要目的是確定現(xiàn)有Mellon用戶購買特定附加產(chǎn)品:家庭普通信貸限額的傾向,利用該工具可生成用于檢測的模型。據(jù)銀行官員稱:IntelligenceAgent可幫助用戶增強其商業(yè)智能,如交往、分類或回歸分析,依賴這些能力,可對那些有較高傾向購買銀行產(chǎn)品、服務(wù)產(chǎn)品和服務(wù)的客戶進行有目的的推銷。該官員認(rèn)為,該軟件可反饋用于分析和決策的高質(zhì)量信息,然后將信息輸入產(chǎn)品的算法。IntelligenceAgent還有可定制能力。

  美國Firstar銀行使用Marksman數(shù)據(jù)挖掘工具,根據(jù)客戶的消費模式預(yù)測何時為客戶提供何種產(chǎn)品。Firstar銀行市場調(diào)查和數(shù)據(jù)庫營銷部經(jīng)理發(fā)現(xiàn):公共數(shù)據(jù)庫中存儲著關(guān)于每位消費者的大量信息,關(guān)鍵是要透徹分析消費者投入到新產(chǎn)品中的原因,在數(shù)據(jù)庫中找到一種模式,從而能夠為每種新產(chǎn)品找到最合適的消費者。Marksman能讀取800到1000個變量并且給它們賦值,根據(jù)消費者是否有家庭財產(chǎn)貸款、賒帳卡、存款證或其它儲蓄、投資產(chǎn)品,將它們分成若干組,然后使用數(shù)據(jù)挖掘工具預(yù)測何時向每位消費者提供哪種產(chǎn)品。預(yù)測準(zhǔn)客戶的需要是美國商業(yè)銀行的競爭優(yōu)勢。

標(biāo)簽:內(nèi)蒙古 山西 承德 黃石 防城港 棗莊 贛州 大同

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《數(shù)據(jù)挖掘及其在商業(yè)銀行中的作用》,本文關(guān)鍵詞  數(shù)據(jù)挖掘,及其,在,商業(yè),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《數(shù)據(jù)挖掘及其在商業(yè)銀行中的作用》相關(guān)的同類信息!
  • 本頁收集關(guān)于數(shù)據(jù)挖掘及其在商業(yè)銀行中的作用的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章