1、摘要
數(shù)據(jù)是一種重要的資源,已經(jīng)成為一種社會生產(chǎn)要素,被提升為和勞動、土地和資本同等重要的地位。數(shù)據(jù)科學(xué)家和權(quán)威專家維克托.邁爾.舍恩伯格在其《大數(shù)據(jù)時代》中指出:雖然大數(shù)據(jù)還沒有被列入企業(yè)的資產(chǎn)負(fù)債表,但這只是一個時間問題。由此可見,這個時間越來越近了。事實上,最近幾年,許多人認(rèn)為數(shù)據(jù)是一種資產(chǎn),但是究竟什么是數(shù)據(jù)資產(chǎn)?如何管理數(shù)據(jù)資產(chǎn)?數(shù)據(jù)資產(chǎn)管理和數(shù)據(jù)管理有什么不同?盡管出現(xiàn)了很多專家和專著,但真正理解這個概念的人并不多,懂得如何實操數(shù)據(jù)資產(chǎn)管理的更寥寥無幾。筆者作為第一批數(shù)據(jù)資產(chǎn)管理的探索者,有幸參與了國內(nèi)幾個典型項目,想借本文從數(shù)據(jù)資產(chǎn)全生命周期這個角度和業(yè)界同仁們分享一點自己的思考和心得。
數(shù)據(jù)資產(chǎn)全生命周期管理模型是設(shè)計良好的用于組織數(shù)據(jù)資產(chǎn)的框架,有許多工作要根據(jù)數(shù)據(jù)資產(chǎn)全生命周期管理模型來提出新的數(shù)據(jù)管理要求。截止目前,國內(nèi)外還沒有數(shù)據(jù)資產(chǎn)全生命周期管理的相關(guān)模型,如同任何其它資產(chǎn)一樣,數(shù)據(jù)資產(chǎn)也具有生命周期,管理數(shù)據(jù)資產(chǎn)就是管理數(shù)據(jù)全生命周期。本文借鑒資產(chǎn)全生命周期管理理念和數(shù)據(jù)生命周期管理模型,根據(jù)大數(shù)據(jù)的特點,提出一種適用于數(shù)據(jù)資產(chǎn)管理的全生命周期模型,從而推動數(shù)據(jù)生產(chǎn)、使用、治理,實現(xiàn)效益最大化。
2、什么是資產(chǎn)全生命周期管理?
假設(shè)數(shù)據(jù)是一種資產(chǎn),那么是不是可以借鑒傳統(tǒng)資產(chǎn)全生命周期管理的理論呢?首先,讓我們一起來看看什么是資產(chǎn)全生命周期管理。
資產(chǎn)全生命周期管理是指資產(chǎn)從構(gòu)思、決策、設(shè)計、建造、使用,經(jīng)過有形磨損,直至在技術(shù)上或經(jīng)濟上不宜繼續(xù)使用,需要進(jìn)行更新所經(jīng)歷的時間,開展資產(chǎn)全生命周期管理的目的就是加強資產(chǎn)管理。降低資產(chǎn)維護(hù)檢修成本,延長資產(chǎn)使用時間,提高資產(chǎn)利用率。
以典型的設(shè)備資產(chǎn)為例,其全生命周期一般包括以下六個環(huán)節(jié):
從設(shè)備設(shè)計、采購開始,直至設(shè)備運行、維護(hù)、報廢進(jìn)行全生命周期管理;將基建期圖紙、采購、資料信息帶到設(shè)備臺賬中,實現(xiàn)對設(shè)計數(shù)據(jù)、采購數(shù)據(jù)、施工數(shù)據(jù)、安裝數(shù)據(jù)、調(diào)試數(shù)據(jù)等后期移交和設(shè)備系統(tǒng)生產(chǎn)運維所需要的完整數(shù)據(jù)平滑過渡,實現(xiàn)基建、生產(chǎn)一體化,提升企業(yè)資產(chǎn)利用率,增強企業(yè)投資回報率。同時結(jié)合成本管理、財務(wù)管理,既實現(xiàn)對資產(chǎn)過程管控,更實現(xiàn)對資產(chǎn)價值的管理。
由此可見,資產(chǎn)全生命周期管理是從長期效益出發(fā),以設(shè)備全生命周期整體最優(yōu)為管理目標(biāo),打破部門界限,將規(guī)劃、基建、運行等不同階段的成本統(tǒng)籌考慮,追求設(shè)備資產(chǎn)經(jīng)濟效益最大化,在最佳的可靠性水平和有效地利用資產(chǎn)之間尋求平衡。
3、數(shù)據(jù)全生命周期管理模型研究
數(shù)據(jù)全生命周期管理模型定義了一個宏觀的框架,它是從生產(chǎn)階段到消費階段的數(shù)據(jù)生命的全景視圖。數(shù)據(jù)全生命周期管理模型的目標(biāo)是優(yōu)化數(shù)據(jù)管理,提高效率,降低成本,以提供適合最終用戶使用的數(shù)據(jù)產(chǎn)品,滿足預(yù)期的質(zhì)量要求,這和資產(chǎn)全生命周期管理的目標(biāo)是一致的。但是,因為數(shù)據(jù)有很多自身的特點,又不完全相同。在數(shù)據(jù)管理領(lǐng)域,學(xué)術(shù)界和企業(yè)界的許多研究人員提出了不同的數(shù)據(jù)全生命周期管理模型。
3.1 CSA模型
云安全聯(lián)盟(CSA)是管理安全云計算環(huán)境的世界領(lǐng)先組織。CSA為云環(huán)境中的數(shù)據(jù)安全提出了一個數(shù)據(jù)生命周期模型。提供的數(shù)據(jù)模型有六個階段,分別是創(chuàng)建、存儲、使用、共享、存檔和銷毀,如圖2所示。因此,這個模型解決了云計算環(huán)境中的一個特殊問題,安全性。
研究結(jié)論:此模型涵蓋的內(nèi)容并不全面,因為它是為云計算模型中的數(shù)據(jù)安全而設(shè)計的。因此,并未考慮數(shù)據(jù)質(zhì)量、數(shù)據(jù)處理和數(shù)據(jù)分析等概念。
3.2 DataONE模型
地球數(shù)據(jù)觀測網(wǎng)是由美國國家科學(xué)基金會(NSF)資助的一個名為“數(shù)據(jù)一號”的組織。他們的數(shù)據(jù)模型旨在為生物和環(huán)境科學(xué)研究提供數(shù)據(jù)保存和再利用。擬議的數(shù)據(jù)生命周期包括收集、保證、描述、存放、保存、發(fā)現(xiàn)、集成和分析,如圖3所示。因此,該模型可以用于存儲和檢索長期使用的信息。
研究結(jié)論:該模型是專門為數(shù)據(jù)保存和復(fù)用而開發(fā)的,不能看作是一個綜合模型。此外,對數(shù)據(jù)安全也沒有任何關(guān)注。
3.3 DDI模型
數(shù)據(jù)文件倡議(DDI)是大學(xué)間政治和社會研究聯(lián)合會(ICPSR)的一個項目。DDI試圖為社會科學(xué)數(shù)據(jù)資源的描述生成元數(shù)據(jù)規(guī)范。所提供的模型包括八個元素,它們是研究概念、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)存檔、數(shù)據(jù)分發(fā)、數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)分析和重新調(diào)整用途,如圖4所示。
研究結(jié)論:這幾乎是一個全面的模型,因為它成功地解決了數(shù)據(jù)生命周期中從收集到使用的大多數(shù)步驟。但是,似乎沒有對數(shù)據(jù)質(zhì)量和數(shù)據(jù)安全有任何關(guān)注。
3.4 DigitalNZ模型
DigitalNZ來自數(shù)字新西蘭。他們的目標(biāo)是為用戶收集和增加數(shù)字內(nèi)容的數(shù)量,而數(shù)據(jù)模型是為存檔和使用數(shù)字信息而設(shè)計的。該模型包括選擇、創(chuàng)建、描述、管理、保存、發(fā)現(xiàn)、使用和復(fù)用等步驟,如圖5所示。該模型旨在管理數(shù)據(jù)利益相關(guān)者之間的數(shù)字信息交換。
研究結(jié)論:此模型的設(shè)計只關(guān)注存檔和使用目的,因此不能將其視為一個全面的模型。此外,該模型不提供數(shù)據(jù)分析、數(shù)據(jù)集成、數(shù)據(jù)安全和數(shù)據(jù)質(zhì)量。
3.5 生態(tài)信息學(xué)模型
生態(tài)信息學(xué)是幫助科學(xué)家處理相關(guān)生物、環(huán)境和社會經(jīng)濟數(shù)據(jù)和信息的框架。該模型旨在通過發(fā)現(xiàn)、管理、集成、分析、可視化和保存相關(guān)數(shù)據(jù)和信息的創(chuàng)造性工具和方法來構(gòu)建新知識。如圖6所示,計劃、收集、保證、描述、保存、發(fā)現(xiàn)、集成和分析是該模型的步驟。因此,該模型提供了一個框架,以實現(xiàn)對某些特定科學(xué)的數(shù)據(jù)和信息的新見解。
研究結(jié)論:此框架設(shè)計幾乎是一個全面的模型,因為它是為數(shù)據(jù)收集、數(shù)據(jù)保存、數(shù)據(jù)發(fā)現(xiàn)和一些數(shù)據(jù)操作(如數(shù)據(jù)集成和數(shù)據(jù)分析)而設(shè)計的。然而,數(shù)據(jù)安全仍然沒有包括在內(nèi),所以它實際上也不是一個綜合模型。此模型看起來與DataONE模型非常相似,但在第一步中它們有所不同。
3.6 一般科學(xué)模型
通用科學(xué)模型由科學(xué)機構(gòu)提供,用于管理科學(xué)數(shù)字?jǐn)?shù)據(jù)。此模型可用于管理用于存檔或處理數(shù)據(jù)的數(shù)據(jù)收集方法。
通用科學(xué)數(shù)據(jù)模型將計劃、收集、集成和轉(zhuǎn)換、發(fā)布、發(fā)現(xiàn)和通知以及存檔或丟棄作為生命周期的六個階段。這個模型,如圖7所示,可以用數(shù)據(jù)管理計劃使用的特定技術(shù)來預(yù)測下一組數(shù)據(jù)采集。
研究結(jié)論:此模型不是整個數(shù)據(jù)生命周期的綜合模型,因為它是專門為數(shù)據(jù)存檔和處理而設(shè)計的。該模型不關(guān)心數(shù)據(jù)分析、數(shù)據(jù)安全和數(shù)據(jù)質(zhì)量。
3.7 地理空間模型
地理空間數(shù)據(jù)生命周期模型由聯(lián)邦地理數(shù)據(jù)委員會(FGDC)支持。該模型旨在為地理和相關(guān)空間數(shù)據(jù)活動探索和保存有價值的信息。圖8總結(jié)了地理空間數(shù)據(jù)生命周期的各個階段,包括定義、清點/評估、獲取、訪問、維護(hù)、使用/評估和歸檔。處理此模型是為了發(fā)現(xiàn)具有可接受的質(zhì)量和業(yè)務(wù)需求的數(shù)據(jù)以供將來使用。
研究結(jié)論:此模型不能用作綜合模型,因為它是專門為搜索和存檔信息而設(shè)計的。另外,這個模型沒有涉及到循環(huán)中的數(shù)據(jù)分析和數(shù)據(jù)集成。此外,質(zhì)量保證和質(zhì)量控制包括在每個階段。
3.8 德烏斯托大學(xué)模型
西班牙德烏斯托大學(xué)的一組研究人員提出了一種用于智能城市數(shù)據(jù)管理的數(shù)據(jù)生命周期模型。如圖9所示,該模型的不同階段是發(fā)現(xiàn)、捕獲、管理、存儲、發(fā)布、鏈接、利用和可視化。此模型是一個用于在智能城市中發(fā)現(xiàn)、存儲和發(fā)布數(shù)據(jù)的選項。
研究結(jié)論:該模型不能被視為綜合模型,因為它是智能城市數(shù)據(jù)管理的專用模型。此外,模型中沒有對數(shù)據(jù)安全和數(shù)據(jù)質(zhì)量(包括QA和QC)的關(guān)注。
3.9 JISC模型
管理研究數(shù)據(jù)方案下的聯(lián)合信息系統(tǒng)委員會(JISC)致力于英國高等教育和研究的良好研究數(shù)據(jù)管理和共享。所提出的研究模型是為用戶之間的數(shù)據(jù)共享而設(shè)計的。該模型包括七個步驟:計劃、創(chuàng)建、使用、評估、發(fā)布、發(fā)現(xiàn)和復(fù)用,如圖10所示。所提供的模型是一個數(shù)據(jù)共享和發(fā)現(xiàn)框架,作為其全局?jǐn)?shù)據(jù)管理起始點的一部分。
研究結(jié)論:此模型也不是綜合模型,因為它是為數(shù)據(jù)共享和發(fā)現(xiàn)而設(shè)計的。此模型不提供任何數(shù)據(jù)處理、數(shù)據(jù)集成和數(shù)據(jù)分析階段。此外,該模型涵蓋了“評估”步驟下的質(zhì)量控制概念,但未提供質(zhì)量保證。
3.10 英國數(shù)據(jù)存檔模型
英國數(shù)據(jù)檔案館是英國最大的數(shù)字?jǐn)?shù)據(jù)(包括社會和經(jīng)濟數(shù)據(jù))收集機構(gòu)之一。英國的數(shù)據(jù)存檔模式側(cè)重于數(shù)字?jǐn)?shù)據(jù)的獲取、管理和存檔。該模型包括創(chuàng)建數(shù)據(jù)、處理數(shù)據(jù)、分析數(shù)據(jù)、保存數(shù)據(jù)、訪問數(shù)據(jù)和復(fù)用數(shù)據(jù),并將它們組織為一個周期,如圖11所示。因此,該模型對于跨數(shù)字?jǐn)?shù)據(jù)的存檔和發(fā)現(xiàn)是一個很好的選擇。
研究結(jié)論:該模型可以假設(shè)為一個綜合模型,因為它提供了完整的數(shù)據(jù)生命周期,包括采集、管理和保存。但是,此模型不包括數(shù)據(jù)質(zhì)量。
3.11 USGS模型
美國地質(zhì)調(diào)查局(USGS)數(shù)據(jù)集成社區(qū)(CDI)致力于處理與美國地質(zhì)局科學(xué)研究相關(guān)的數(shù)據(jù)和信息管理問題。USGS數(shù)據(jù)模型提供了一個框架,用于評估和改進(jìn)管理科學(xué)數(shù)據(jù)的政策和實踐,并確定需要新工具和標(biāo)準(zhǔn)的領(lǐng)域。該模型包括主要的和橫切的模型元素,如圖12所示。主要的模型元素是計劃、獲取、處理、分析、保存和發(fā)布/共享。此外,橫切模型元素還附帶了描述、管理質(zhì)量、備份和安全等步驟。因此,該模型可以為科學(xué)數(shù)據(jù)的管理提供參考,以獲得更好的標(biāo)準(zhǔn)和工具。
研究結(jié)論:這個模型可以被認(rèn)為是一個綜合的模型,因為它為采集、整理和保存建議了數(shù)據(jù)周期。然而,該模型不包括數(shù)據(jù)安全,因為“存儲和安全”元素中的安全含義是指物理風(fēng)險,例如硬件和軟件故障。
3.12 北京郵電大學(xué)模型
該模型隸屬于北京郵電大學(xué)的一個研究小組。此模型用于云計算環(huán)境中的數(shù)據(jù)安全。圖13所示的基于圖的模型有五個階段,分別是創(chuàng)建、存儲、使用和共享、存檔和銷毀。該模型適用于云環(huán)境中的安全性。
研究結(jié)論:這個模型不能被認(rèn)為是一個全面的模型,因為它的設(shè)計只支持云中的數(shù)據(jù)安全。此外,它不包括數(shù)據(jù)質(zhì)量、數(shù)據(jù)分析和數(shù)據(jù)發(fā)布等階段。
3.13 PII模型
個人身份信息生命周期模型涵蓋了從創(chuàng)建到存儲的PII數(shù)據(jù)。它從個人信息保護(hù)的視角,將生命周期劃分為采集、處理、存儲、轉(zhuǎn)移和維護(hù),如圖14所示。
研究結(jié)論:雖然這個生命周期是封閉的,但它包含銷毀過時數(shù)據(jù)的步驟。在這個周期的每一個步驟中,我們都注意到添加了額外的信息來保持信息的可跟蹤性。
3.14 DAMA模型
DAMA(國際數(shù)據(jù)管理協(xié)會)認(rèn)為有效的數(shù)據(jù)數(shù)據(jù)管理開始于數(shù)據(jù)獲取之前,企業(yè)應(yīng)先制定數(shù)據(jù)規(guī)劃,定義數(shù)據(jù)規(guī)范,然后再進(jìn)行開發(fā)實施、創(chuàng)建和獲取、維護(hù)和使用、存檔和檢索,最后是清除。
研究結(jié)論:DAMA數(shù)據(jù)生命周期模型也不能看作是一個全面的模型,因為它并沒有考慮數(shù)據(jù)安全、數(shù)據(jù)質(zhì)量和數(shù)據(jù)共享分布等內(nèi)容,而且它只給出了階段劃分,并沒有詳細(xì)說明每一階段的具體內(nèi)容,只是一個理論模型。
3.15 對比分析
為了進(jìn)行分析,我選擇了20個階段:定義、計劃、開發(fā)實施、創(chuàng)建/接收、處理、保證、描述、管理、存儲、分發(fā)、發(fā)現(xiàn)、集成、維護(hù)、使用、可視化、評估、復(fù)用、共享/發(fā)布和歸檔。通過對比分析可以發(fā)現(xiàn)有些階段是每個模型共同的;比如創(chuàng)建/接收,有些階段則是獨有的,比如可視化。令我感到意外的是數(shù)據(jù)歸檔和銷毀居然很少有模型涉及,這說明很多模型并沒有把數(shù)據(jù)當(dāng)作資產(chǎn)來看待,并沒有考慮數(shù)據(jù)管理的效益最大化,這也正是設(shè)計數(shù)據(jù)資產(chǎn)全生命周期模型的必要。為了使我的比較客觀且直觀呈現(xiàn),我制作了一個分析圖表。
之后,根據(jù)統(tǒng)計分析,結(jié)合大數(shù)據(jù)的特點已經(jīng)企業(yè)實踐經(jīng)驗保留了11個階段,包括計劃、定義、創(chuàng)建/接收、處理、集成、存儲、運維、共享、發(fā)現(xiàn)、使用和復(fù)用、歸檔&銷毀。
然后,我為每個生命周期分配一個分?jǐn)?shù),以便于評估模型。
這個排名也證實了DAMA在數(shù)據(jù)管理領(lǐng)域的專業(yè)地位,這是一個模型,幾乎包含了我在分析中保留的所有階段。我們在這個周期中唯一的缺點是數(shù)據(jù)集成、共享和發(fā)現(xiàn)階段仍然沒有,這幾個階段在數(shù)據(jù)使用過程中很重要。因此,我將此生命周期模型作為基礎(chǔ),同時利用USGS、生態(tài)信息學(xué)模型和DCI等模型來彌補DAMA模型中的缺項。接下來,我將介紹一種適用于數(shù)據(jù)資產(chǎn)管理全生命周期管理的模型。
4、數(shù)據(jù)資產(chǎn)全生命周期模型
我分析并描述了大多數(shù)數(shù)據(jù)生命周期模型。數(shù)據(jù)生命周期模型的出現(xiàn)表明,對數(shù)據(jù)管理和移動性的新要求給傳統(tǒng)的數(shù)據(jù)生命周期模型增加了一些具體的步驟,如數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全、數(shù)據(jù)復(fù)用等。此外,許多模型都是為解決數(shù)據(jù)管理中的一個特定問題或特定目的而設(shè)計的。當(dāng)然,每個模型對于他們的研究或項目需求來說都是一個合適的設(shè)計,而且,它們可能會留下一些挑戰(zhàn)需要解決,因為這些挑戰(zhàn)超出了他們的目標(biāo)范圍。基于這個原因,我想知道是否有一個綜合的模型能夠成功地滿足數(shù)據(jù)資產(chǎn)管理的需求。數(shù)據(jù)資產(chǎn)全生命周期模型(Data Asset
Life Cycle Model,簡稱DALCM)主要貢獻(xiàn)是消除企業(yè)或組織在為任何新項目設(shè)計新模型時的認(rèn)知差異和浪費。
數(shù)據(jù)資產(chǎn)全生命周期分為4大期間和11階段。4大期間包括數(shù)據(jù)資產(chǎn)生成的“入”期、數(shù)據(jù)資產(chǎn)保存的“存”期、數(shù)據(jù)資產(chǎn)應(yīng)用的“用”期和數(shù)據(jù)資產(chǎn)退出的“出”期。四大期間下包含11個階段,有效的數(shù)據(jù)資產(chǎn)管理始于數(shù)據(jù)的產(chǎn)生之前開始,首先應(yīng)該做好規(guī)劃和計劃,包括數(shù)據(jù)資產(chǎn)盤點、數(shù)據(jù)治理計劃、數(shù)據(jù)需求計劃等;然后對數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行定義,制定數(shù)據(jù)管理規(guī)范,確保數(shù)據(jù)按照標(biāo)準(zhǔn)產(chǎn)生,從源頭抓起,有句古詩說得特別好:“問渠那得清如許?為有源頭活水來。”。在“存”的期間內(nèi),處理和存儲都沒什么好說的,比較容易理解,在這里把“集成”放進(jìn)來主要是考慮到數(shù)據(jù)資產(chǎn)管理需要打通數(shù)據(jù)孤島,數(shù)據(jù)只有集成起來才能發(fā)揮更大的價值。只有實現(xiàn)了數(shù)據(jù)集成,數(shù)據(jù)倉庫才能稱之為數(shù)據(jù)倉庫,否則即使把數(shù)據(jù)集中起來存儲,也只能叫做數(shù)據(jù)垃圾堆。“用”這個期間是真正產(chǎn)生價值的周期,其他周期都是成本,數(shù)據(jù)因使用而生值,用處越多價值越大。在“用”這個期間要特別強調(diào)“數(shù)據(jù)復(fù)用”這個階段,時下比較流行的數(shù)據(jù)中臺架構(gòu),我認(rèn)為最大的一個價值就是數(shù)據(jù)復(fù)用和服務(wù)復(fù)用,這對于節(jié)省成本,提高效率非常重要。未來企業(yè)或組織在評估一個數(shù)據(jù)產(chǎn)品值不值得開發(fā)很重要的一個指標(biāo)應(yīng)該看能不能復(fù)用。當(dāng)然,如果不能復(fù)用,單個項目的收益足夠大的時候,也是可以投入的。“出”也非常重要,雖然現(xiàn)在存儲的價格越來越低,但是如果不加以管理也會產(chǎn)生很大的負(fù)擔(dān),對于數(shù)據(jù)資產(chǎn)整體效益不利。另外,如不加以區(qū)分,本該歸檔或者清除的數(shù)據(jù)和活躍的數(shù)據(jù)存放在一起,將嚴(yán)重影響效率。
數(shù)據(jù)運維提供保障,主要負(fù)責(zé)對數(shù)據(jù)庫進(jìn)行日常維護(hù),對數(shù)據(jù)進(jìn)行備份、恢復(fù)。確保數(shù)據(jù)完整性、一致性、及時性,保證數(shù)據(jù)質(zhì)量。還要提供數(shù)據(jù)安全方面的防護(hù),進(jìn)行用戶授權(quán)、身份認(rèn)證和訪問行為監(jiān)控等,并保密級別較高的數(shù)據(jù)進(jìn)行數(shù)據(jù)加密、脫敏、匿名化等操作。
數(shù)據(jù)資產(chǎn)運營是DALCM區(qū)別于數(shù)據(jù)生命周期不同之處。數(shù)據(jù)資產(chǎn)運營以數(shù)據(jù)資產(chǎn)效益最大化為目標(biāo),包括數(shù)據(jù)資產(chǎn)全生命周期成本核算、數(shù)據(jù)資產(chǎn)價值評估、數(shù)據(jù)資產(chǎn)變現(xiàn)、數(shù)據(jù)資產(chǎn)活性分析和數(shù)據(jù)資產(chǎn)投資收益分析等內(nèi)容。
5 、企業(yè)實踐
筆者發(fā)現(xiàn)很多人在談數(shù)據(jù)生命周期管理的時候,只是提出了一個概念或者大概知道劃分哪些階段,但是并不知道具體怎么做,或者每個階段從管理上和技術(shù)上怎么操作。
下面,筆者就以數(shù)據(jù)銷毀階段為例,簡單介紹一下我在實踐中的具體做法。
首先,根據(jù)數(shù)據(jù)的血緣關(guān)系,繪制出整個數(shù)據(jù)調(diào)用的關(guān)系鏈,如下圖所示:
父級數(shù)據(jù)節(jié)點(如上圖,父表是兒子表和兒媳表的父級節(jié)點)的活性等于自身的調(diào)用次數(shù)加上所有子節(jié)點的調(diào)用次數(shù)。
舉例:比如上圖中父表的活性=父節(jié)點自身的調(diào)用次數(shù)+兒子節(jié)點的調(diào)用次數(shù)+兒媳節(jié)點的調(diào)用次數(shù)+孫子節(jié)點的調(diào)用次數(shù)。
將活性等級劃分為4個區(qū)間,分別為:死透、半死不活、活的一般、活得很好。
根據(jù)數(shù)據(jù)活性評估模型評估數(shù)據(jù)資產(chǎn)所處在的區(qū)間。通過一個月不間斷的評估,根據(jù)每天評估結(jié)果的算術(shù)平均值。每月出具數(shù)據(jù)活性分析報告,為數(shù)據(jù)管理提供決策支持,比如:對死透的數(shù)據(jù)選擇進(jìn)行銷毀、遷移到低成本存儲設(shè)備或者想辦法激活。有的數(shù)據(jù)雖然不在活動,也不能直接銷毀,比如國家或行業(yè)監(jiān)管有要求保存期限的。對于半死不活的數(shù)據(jù)可以考慮怎么樣激活,讓其被更多的利用,以創(chuàng)造更大的價值。
最后,還是得借助IT支撐工具實現(xiàn)自動化管理。通過數(shù)據(jù)資產(chǎn)全生命周期管理系統(tǒng),可視化呈現(xiàn)Top100數(shù)據(jù)活性最高的數(shù)據(jù)資產(chǎn),自動出具數(shù)據(jù)活性分析報告,列示超過12個月的死掉的數(shù)據(jù)清單,根據(jù)處理結(jié)果,統(tǒng)計釋放的存儲空間、節(jié)約的成本以及提升的效率,并繪制相應(yīng)的變化趨勢圖。通過數(shù)據(jù)資產(chǎn)目錄系統(tǒng)展示每一項數(shù)據(jù)資產(chǎn)的活性,以便于數(shù)據(jù)資產(chǎn)管理人員以及數(shù)據(jù)使用人員決策。
下一步,計劃結(jié)合數(shù)據(jù)資產(chǎn)地圖和數(shù)據(jù)資產(chǎn)活性繪制一份數(shù)據(jù)資產(chǎn)熱力圖(如圖21所示),更加直觀地呈現(xiàn)核心數(shù)據(jù)資產(chǎn)的分布和流向等。
6、總結(jié)
隨著數(shù)字經(jīng)濟時代的到來,數(shù)據(jù)是一種資產(chǎn)被廣泛認(rèn)可,數(shù)據(jù)資產(chǎn)生命周期在各種數(shù)據(jù)管理框架中被提及,但是并沒有一個權(quán)威的數(shù)據(jù)資產(chǎn)全生命周期模型。筆者首先回顧了傳統(tǒng)資產(chǎn)全生命周期管理模型,然后分析了國內(nèi)外幾種數(shù)據(jù)生命周期模型的優(yōu)缺點,再結(jié)合企業(yè)實踐經(jīng)驗,提出了DALCM模型(數(shù)據(jù)資產(chǎn)全生命周期模型)。本文的附加價值介紹了數(shù)據(jù)銷毀的具體做法,企業(yè)或組織看完后是立馬可以施行的。
7、參考
1.DAMA模型.參考資料:DMBOK2.0,2017.2.5.9:p.28~29
2.https://cloudsecurityalliance.org/about
3.https://www.dataone.org/about
4.國際數(shù)字管理雜志, 2008.3(1): p. 134-140
5.www.ddialliance.org/system/files/Concept-Model-WD.pdf
6.http://www.digitalnz.org/about
7.http://www.dcc.ac.uk/about-us
8.http://www.dcc.ac.uk/resources/curationlifecycle-model
9.http://www.digitalnz.org/make-it-digital
10.https://.www.fgdc.gov/policyandplanning/a-16
11.http://lod2.eu
12.http://archives.msu.edu/records
13.http://webarchive.nationalarchives.gov.uk/20140702233839
14.http://www.jisc.ac.uk/whatwedo/programmes/mrd.aspx
15.http://www.data-archive.ac.uk/about