http://www.360doc.com/showweb/0/0/947384105.aspx
文丨赵博智 编辑丨沐阳
来源丨首席数字官
在数字经济时代,数据已经成为当下十分重要的资源,随着越来越多的企业开始意识到数据的重要性,把数据当作数据资产。但在数据资产全生命周期中,如何对其进行管理?企业进行数据资产全生命周期管理的前提和基础是什么?主流模型有哪些?
6月19日晚,锦囊专家联合首席数字官、数字产业创新研究中心共同打造了网络研讨会:如何进行数据资产生命周期管理。从生命周期的角度同四位主讲嘉宾:数据资产管理专家李然辉、数据资产管理专家杨通鹏、广州首席信息官协会秘书长苏衡、ThoughtWork中国区数据和AI总经理史凯一起展开深度讨论。
本文为【首席数据官】总结、提炼本次研讨会议四位主讲嘉宾的精华观点编辑而成,欢迎阅读和分享。如想了解更多会议精彩,可点击文尾“阅读原文”收看回放视频。
什么是数据资产全生命周期管理?
数据资产是一个新的概念,因为它是一种无形资产,所以对于它的管理可分为四个阶段,入,在生产过程中对数据进行采集和获取;存,将采集到的数据整合到数据中心进行系统的管理、分类;用,找到数据的价值,将数据的加工成服务和产品进而创造业务价值;出,整个价值周期结束。通过入、存、用、出四个阶段构成数据资产全生命周期管理的闭环。
企业数据资产全生命周期管理的前提和基础是什么?
数据不等于数据资产,数据必须以合理、易用、安全和易于理解的方式组织起来,能为业务注入有效的价值才能作为数据资产。数据变成数据资产的前提是有着完整的数据标准管理、数据质量管理、数据安全管理、易于使用的元数据管理和持续产生数据价值管理的从数据产生到销毁的数据全生命周期管理体系。
企业数据资产全生命周期管理的基础是,企业首先应树立数据资产的意识形态,只有真正把数据当做资产看待的时候才会通过数据看到产品的收益和价值,并在后续产品开发之前提前指定数据资产生命周期管理方案。
其次,数据资产建立之前需要统一的数据标准描述资产模型和收集信息的维度,例如通过用户ID打通信息孤岛,获取手机、邮箱、身份证等信息,进行数据资产的统一建模。
最后,需要对数据资产的处理历史进行跟踪,将数据资产从产生到内部业务集成、数仓、应用的全过程打通,通过精细化的管理,为数据成本核算、收集投资收益等信息建立良好基础。
数据治理和数据资产管理的关系?
数据治理是一门将数据视为一项企业资产的学科。数据治理是针对数据管理的质量控制规范,它将严密性和纪律性植入企业的数据管理、利用、优化和保护过程中。它涉及到以企业资产的形式对数据进行优化、保护和利用的决策权利。它涉及到对组织内的人员、流程、技术和策略的编排,以从企业数据获取最优的价值。
数据资产管理是规划、控制和提供数据及信息资产的一组业务职能,包括开发、执行和监督有关数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、交付和提高数据资产的价值。数据资产管理需要充分融合业务、技术和管理,以确保数据资产保值增值。
有效的数据治理才是数据资产形成的必要条件,有效的数据治理是一个持续性的过程,也是逐步实现数据价值的过程。所以数据治理是企业信息化的基石,数据资产是企业战略发展的核心价值,数据管理为企业赋能。
数据治理和数据资产管理是一个渐进的过程,不是所有数据都可以成为数据资产,只有数据在经过治理的二次加工达到了资产的利用要求并能够产生自身价值之后就变成了数据资产。数据资产的管理过程同样不能脱离数据治理,数据治理是数据变成资产的条件,也是数据资产管理的必备的功能和过程。
数据资产生命周期管理主流模型有哪些?
1. DAMA模型
DAMA(国际数据管理协会)认为有效的数据管理开始于数据获取之前,企业应先制定数据规划,定义数据规范,然后再进行开发实施、创建和获取、维护和使用、存档和检索,最后是清除。但DAMA数据生命周期模型也不能看作是一个全面的模型,因为它并没有考虑数据安全、数据质量和数据共享分布等内容,而且它只给出了阶段划分,并没有详细说明每一阶段的具体内容,只是一个理论模型。
2. 地理空间模型
地理空间数据生命周期模型旨在为地理和相关空间数据活动探索和保存有价值的信息。它总结了地理空间数据生命周期的各个阶段,包括定义、清点/评估、获取、访问、维护、使用/评估和归档。处理此模型是为了发现具有可接受的质量和业务需求的数据以供将来使用。
3. DataONE模型
DataONE数据模型旨在为生物和环境科学研究提供数据保存和再利用。拟议的数据生命周期包括收集、保证、描述、存放、保存、发现、集成和分析。因此,该模型可以用于存储和检索长期使用的数据信息。同时该模型是专门为数据保存和复用而开发的,不能看作是一个综合模型。
4. 数据资产全生命周期模型
数据资产全生命周期分为4大期间和11阶段。4大期间包括数据资产生成的“入”期、数据资产保存的“存”期、数据资产应用的“用”期和数据资产退出的“出”期。四大期间下包含11个阶段,有效的数据资产管理始于数据的产生之前开始,首先应该做好规划和计划,包括数据资产盘点、数据治理计划、数据需求计划等;然后对数据标准进行定义,制定数据管理规范,确保数据按照标准产生,从源头抓起,有句古诗说得特别好:“问渠那得清如许?为有源头活水来。”。在“存”的期间内,处理和存储都没什么好说的,比较容易理解,在这里把“集成”放进来主要是考虑到数据资产管理需要打通数据孤岛,数据只有集成起来才能发挥更大的价值。只有实现了数据集成,数据仓库才能称之为数据仓库,否则即使把数据集中起来存储,也只能叫做数据垃圾堆。“用”这个期间是真正产生价值的周期,其他周期都是成本,数据因使用而生值,用处越多价值越大。在“用”这个期间要特别强调“数据复用”这个阶段,时下比较流行的数据中台架构,最大的一个价值就是数据复用和服务复用,这对于节省成本,提高效率非常重要。未来企业或组织在评估一个数据产品值不值得开发很重要的一个指标应该看能不能复用。当然,如果不能复用,单个项目的收益足够大的时候,也是可以投入的。“出”也非常重要,虽然现在存储的价格越来越低,但是如果不加以管理也会产生很大的负担,对于数据资产整体效益不利。另外,如不加以区分,本该归档或者清除的数据和活跃的数据存放在一起,将严重影响效率。
传统企业如何做数据资产全生命周期管理?
传统企业的数据资产管理需要有持续的信息化、数字化投入打基础,整体策略是统筹推动,以用促建、急用先行。
业务数字化是数据资产管理的前提。企业要持续进行业务对象数字化、业务规则数字化和业务过程数字化,解决数据有源的问题。业务数字化通常由业务部门驱动,IT使能部门协同推进。
数据汇聚入湖是建设数据资产的基础。企业可以从逻辑上汇聚内外部、结构化/非结构化等异构多源数据,为数据中台提供完整、清洁的原始数据,数据入湖需遵循相关标准(明确数据Owner,做到责任到位、发布数据标准,形成企业统一语言、认证数据源,保证数据有源一致性、定义数据密级,在安全的前提下实现数据共享、评估数据质量,让数据可信可用、注册元数据,形成数据资产地图,方便用户找到所需资产),最终实现数据找得到、可理解、可信任、可消费。
数据中台是建设数据资产的重点。通过业务和数据双驱动,做厚数据中台,重点建设五类数据中台资产,做好数据主题联接,支撑数据消费,核心是将数据按业务流(如合同、销售订单等)、业务对象(如客户、供应商等)、标签(员工、用户画像等)、指标数据(原子指标数据、复合指标等)与算法(机会点挖掘等)进行整合联接,确保数据集成、透明,形成数据主题资产(如客户主题等),支撑自助分析、业务过程可视、智能决策、风险预警和控制、经营与运营报告等数据消费场景。
做好数据资产管理是核心。持续做好元数据管理、数据质量管理,并加强数据安全与个人隐私保护、数据血缘、数据生态能力。基于数据资产,通过数据服务满足数据消费是关键。通过数据分析平台,以API形式将数据服务开放给数据消费者,满足实时可视、风险预警、智能决策等场景下的数据消费需求。
业务数字化实现了数据有源;建设数据底座,实现数据汇聚和数据资产管理;开发数据服务,减少重复投资,在保障数据安全的前提下满足多场景的数据资产消费。
不同行业和不同企业类型数据资产全生命周期管理的差异性?
对于大部分企业来讲,可以在短期内优先获取和利用与自身业务更相近、更能产生业务价值的数据。对于头部企业且对行业有垄断愿景的企业,可以制定计划,在两年半到时间里中把数据分层,对于不会随时间而衰减的、价值延续性比较长的数据,在发挥价值的时候便会成为企业自身不可被超越的垄断性资源。
互联网企业在数据资产全生命周期管理方面是否具有先天优势?
互联网强企业在管理数据资产是相较于传统企业难度更高,数据资产的管理是一项长期的工作,互联网企业在应对外部数据的产生和变化时需要不断尝试和试错,与传统企业不同的是互联网企业更为注重数据产生所带来的价值收益和业务增长,若按照传统的标准和计划去实施则会变得非常困难。
但两种企业的共同点在于都需要建立并管理数据资产目录,与信息安全、数据服务、数据分析等方面两者都有共同的诉求。很多传统企业现在也在逐步重视数据资产生命周期,在当前疫情之下,也涌现了不少数字化转型成功的传统企业。
当前企业数据资产全生命周期管理的痛点与难点?
数据组织方面,很多企业也缺乏专业的数据资产管理组织;数据管控流程方面,跨域跨专业数据管控流程尚未建立、跨域数据管理技术手段尚不完善;IT架构方面,采用烟囱式的传统IT架构,使得企业在进行数据资产管理时会遇到数据分散、规模大、种类多、质量差的问题,导致了数据变现的困难。同时在数据安全方面,很多企业没有进行数据密级的控制,使企业在做数据分享时会遇到不知道该不该给、该给多少的问题,存在数据安全问题。
数据资产全生命周期管理的实践价值?
第一,使企业降低成本。数据成本和效率之间本身存在矛盾,很多公司在做大数据时会用空间换时间,随着数据的增长,如不及时进行管理和存储最终会影响到计算效率,导致成本既存储空间不断增长。
第二,规避风险。在对数据进行监管和审计是会对相关数据进行保留,在客户丢失个人信息时,可以进行全程追溯,做到风险规避。
第三,提高数据质量。数据管理的重要目标之一就是提升数据的质量,不通过全生命周期管理数据很难保证数据整体的质量水平,在系统前期建设和开发过程中需要指定完善的业务规则和标准,保证得到高质量的数据。
第四,价值最大化。不做全生命周期管理则无法从数据上着眼价值和利益的最大化,企业在投资项目前可以通过数据看到产品背后的成本和预期收益,从而对投资是否合理做出判断。
以上为归纳总结各嘉宾观点后得出的数据资产全生命周期管理十大核心问题,除此之外,如想了解更多精彩内容欢迎登录锦囊专家官网收看本次会议完整直播。