劣質(zhì)數(shù)據(jù)會(huì)妨礙一個(gè)機(jī)構(gòu)的商務(wù)智能系統(tǒng)或者數(shù)據(jù)存儲(chǔ)項(xiàng)目。本站客座專欄作家瑞克•謝爾曼解釋了如何避免那些影響努力結(jié)果的常規(guī)問題。
很多商務(wù)智能系統(tǒng)或者數(shù)據(jù)存儲(chǔ)項(xiàng)目都受到與數(shù)據(jù)質(zhì)量有關(guān)的并發(fā)癥的干擾。有時(shí)候這些問題不會(huì)顯現(xiàn),直到商務(wù)人員即將啟動(dòng)項(xiàng)目之前對系統(tǒng)進(jìn)行測試時(shí)才會(huì)暴露。那么,是什么導(dǎo)致BI項(xiàng)目團(tuán)隊(duì)對數(shù)據(jù)質(zhì)量問題產(chǎn)生疏漏呢?
有兩點(diǎn)主要的漏洞:對數(shù)據(jù)質(zhì)量的定義太狹窄,認(rèn)為數(shù)據(jù)質(zhì)量管理是資源系統(tǒng)的事。
人們通常認(rèn)為數(shù)據(jù)質(zhì)量管理就是把壞數(shù)據(jù)剔除掉——即那些或丟失或不準(zhǔn)確或錯(cuò)誤的數(shù)據(jù)。壞數(shù)據(jù)的確是個(gè)問題,但不是唯一的問題。高質(zhì)量的數(shù)據(jù)程序同時(shí)要確保數(shù)據(jù)的全面性、一致性、相關(guān)性和時(shí)效性。
不要埋怨資源系統(tǒng)
對數(shù)據(jù)質(zhì)量的定義太狹窄經(jīng)常導(dǎo)致人們認(rèn)為資源交換系統(tǒng)——不是通過數(shù)據(jù)侵入就是系統(tǒng)錯(cuò)誤——產(chǎn)生了壞數(shù)據(jù)。盡管這也許是一些錯(cuò)誤發(fā)生的原因,但更可能的罪魁不是系統(tǒng)資源間尺度的不同(比如顧客或產(chǎn)品標(biāo)識(shí)符)就是來自不同組織間數(shù)據(jù)定義的不同。確定尺度——形成統(tǒng)一的顧客或產(chǎn)品標(biāo)識(shí)符——對于一家公司的數(shù)據(jù)評估和檢驗(yàn)是非常重要的。資源系統(tǒng)不負(fù)責(zé)通過其他系統(tǒng)的數(shù)據(jù)質(zhì)量問題,這應(yīng)由BI項(xiàng)目團(tuán)隊(duì)來管。資源系統(tǒng)必須確保在其存儲(chǔ)區(qū)域內(nèi)數(shù)據(jù)的正確性。但BI項(xiàng)目團(tuán)隊(duì)的職責(zé)是提供整個(gè)企業(yè)內(nèi)部統(tǒng)一的商業(yè)數(shù)據(jù)。
同樣地,企業(yè)內(nèi)的每一個(gè)部門也許都有正當(dāng)?shù)睦碛商峁┡c其他部門不同的數(shù)據(jù)。比如說,在商業(yè)程序中所處的地位可能會(huì)決定他們?nèi)绾慰创约旱臄?shù)據(jù)。單個(gè)部門的目標(biāo)并不是形成共同的數(shù)據(jù)定義,但BI項(xiàng)目團(tuán)隊(duì)的目標(biāo)是。很多BI項(xiàng)目團(tuán)隊(duì)想申明數(shù)據(jù)質(zhì)量管理不應(yīng)由他們負(fù)責(zé)。然而,從實(shí)際的角度考慮,BI團(tuán)隊(duì)的確需要把這些(數(shù)據(jù)質(zhì)量管理)事務(wù)當(dāng)作自己的分內(nèi)之事,因?yàn)樗麄兊墓ぷ骶褪谴_保最高的數(shù)據(jù)質(zhì)量。BI項(xiàng)目團(tuán)隊(duì)在對數(shù)據(jù)進(jìn)行打包提供給商務(wù)人員使用,他們將承擔(dān)數(shù)據(jù)質(zhì)量的負(fù)責(zé)。這看上去并不公平,但他們項(xiàng)目的成功正基于此。
不要低估了故障
當(dāng)項(xiàng)目出現(xiàn)一個(gè)初始故障或泄漏僅影響到資源系統(tǒng)的一個(gè)很小的子系統(tǒng)時(shí)是令人吃驚的。由于可能存在種種理由允許發(fā)生小范圍的故障,當(dāng)資源一同的數(shù)量擴(kuò)大時(shí),你將無法從確定尺度的必要的努力中受益。
有時(shí)故障僅發(fā)生在單個(gè)的部門,該部門對獲取的數(shù)據(jù)僅采用自己部門內(nèi)的定義標(biāo)準(zhǔn)。再一次地,棘手的問題經(jīng)常是如何調(diào)和各部門之間對數(shù)據(jù)利用時(shí)定義的不同。兩件事情中在處理復(fù)合的系統(tǒng)和部門問題時(shí)都遭遇了實(shí)際的挑戰(zhàn)。商務(wù)人員需要縱觀全局,然而這只有當(dāng)他們能夠?qū)ζ髽I(yè)內(nèi)的數(shù)據(jù)進(jìn)行評估和分析時(shí)才可能實(shí)現(xiàn)。
數(shù)據(jù)質(zhì)量管理的步驟
為確保數(shù)據(jù)質(zhì)量,BI項(xiàng)目團(tuán)隊(duì)必須從一開始就致力于此。這里有一些重要的步驟可供參考。
要求對商業(yè)數(shù)據(jù)進(jìn)行比較寬泛的定義,建立監(jiān)督和測試標(biāo)準(zhǔn),明確數(shù)據(jù)不符合標(biāo)準(zhǔn)時(shí)應(yīng)該采取什么措施。
在進(jìn)行資源系統(tǒng)分析時(shí)努力使數(shù)據(jù)有一個(gè)全面的輪廓。對通過資源系統(tǒng)的反常數(shù)據(jù)的整理和時(shí)間(歷史數(shù)據(jù)并不總是保存的好)都是必需的,以便從商業(yè)運(yùn)作的前期就能對其進(jìn)行處理。
從數(shù)據(jù)來源到商務(wù)人員的信息提取,所有的綜合數(shù)據(jù)和商業(yè)智能程序都要進(jìn)行數(shù)據(jù)質(zhì)量合并。數(shù)據(jù)質(zhì)量問題應(yīng)該盡早在程序中檢查出來并且按照商業(yè)要求的詳細(xì)條款進(jìn)行處理。
企業(yè)必須提供的數(shù)據(jù)要達(dá)到嚴(yán)格的質(zhì)量標(biāo)準(zhǔn)水平,尤其要根據(jù)現(xiàn)行的規(guī)定和要求。只要建立強(qiáng)大的數(shù)據(jù)質(zhì)量管理責(zé)任體系和確保其實(shí)施的步驟,數(shù)據(jù)水平所需的透明度就能實(shí)現(xiàn)。
關(guān)于作者
瑞克•謝爾曼有18年多的商業(yè)智能和數(shù)據(jù)管理經(jīng)驗(yàn),作為獨(dú)立顧問在50多家機(jī)構(gòu)任職,還在一家大五會(huì)計(jì)事務(wù)所任管理/執(zhí)行官。他建立了雅典娜IT咨詢公司,是一家總部位于斯通曼斯的商業(yè)智能顧問公司。他的電子郵箱是rsherman@athena-solutions.com.
來源:TechTarget