公司新闻

数据集市的挑战是识别和办理数据安详

  • 文章来源: / 作者: / 发布时间:2019-05-25
  •   元数据=更好的数据

     

      简而言之,测试包含摄取一个提供的样本数据集,然后演示该平台大幅简化和加快筹备和交付自助式业务就绪数据的才华,包含潜在敏感数据的识别和治理。

     

      “不到10%的数据湖企业正式确定了他们的治理方法。”

     

     

      首席信息官、首席技术官、首席数据官和那些参预或负责信息治理理论的人感遭到了史无前例的压力。为什么?因为大大都的数据湖致力于存储和办理数据,而不是治理数据。

     

      在过去两三年里,很多企业已经或者正在建设数据湖。数据湖领有宏大吸引力:自助式按需访问所有数据,岂论数据存储在哪里。但IT打点人员往往很快发现,由于分歧乎内部数据安详要求,自助式数据打点形式无奈实现。

     

     

     

      当你制定自助式数据战略时,由元数据驱动、通过明确流程打点的数据安详不只可以降低风险,还能为你提供跨越传统数据湖、实现自助式数据集市的真正希望。

     

     

      “到2018年,90%已陈列的数据湖将失效,因为以不确定的使用案例为宗旨而搜集的信息资产会让它们不堪重负。”

     

      数据集市旨在向企业用户提供高质量的自助式数据,协助他们更快地取得洞见。更容易访问更大都据,这只会加剧要求企业安详团队为所有这些可用新信息提供安详保障的重要性。

     

      统计成果显示,假如IT企业员工的治理技能程度乱七八糟,那么公司内部很可能存在数据孤岛,这会加剧整个企业的脆弱性和风险。

     

      很少有人真正知道如何把公司的内部安详政策有效地应用于数据。让当今的商业技术代替以人力停止的猜度,因为没人可能知道所有来源、所有领域的内容。操作丰硕的元数据,再联结形式自动识别,这是在全公司高下推行大规模战略方案的根底。

     

     

     

      交融:元数据、治理和安详

      各级数据专家:你必要领有数据集市治理

      由于企业数据可见性的加强和数据安详团队的要求,数据集市团队面临的挑战是确保某些客户属性被识别和“办理”。要求技术提供商演示对潜在敏感数据的自动识别和操纵,以此来处置惩罚惩罚这个问题。

      想要处置惩罚惩罚这个问题,请明智地选择你的处置惩罚惩罚计划。有一些提供商在做PII探测,并且做得很好,堪为模范。你要找的提供商应该是已经开发出了作为数据打通(data on-boarding)一局部的流程和技术,在字段层面上及早发现可能敏感的形式。这不只仅是出于安详起因。从摄取时就打点所有数据(包含打点数据访问权限),这已经处置惩罚惩罚或缓和了困扰数据湖企业的很多挑战。

     

     

      聚焦PII:个人可识别信息

      大数据要求我们从新反思数据治理。大数据治理不是从物理上把沙盒和消费数据分割开来,而是在数据从“未经加工”到“筹备就绪”的成熟过程中,从逻辑上控制数据的访问和使用。你怎么知道数据能否筹备好用于消费?看元数据。任何撑持消费使用数据的大数据平台都必需领有元数据,追踪数据摄取、安详、验证、筹备和使用的周期。

      这意味着,企图优良的数据湖已经酿成了一个承担而不是共享库,只向一位或少数几位授权用户按需提供安详的数据。这违犯了数据湖的初衷,对信息搜寻者来说既消耗了资源,又没有得到益处。

     

      信息治理涵盖多个方面,包含精确性、完好性、一致性、可访问性、隐私和信息安详。在本文中,我们不探讨信息治理的所有方面,而是专注于数据安详及其在这一背景下的意义。

      假如你正在打造一个精心设想、有效执行的数据集市,你可能面临很多挑战,包含如何护卫你的数据。所有的安详门径都用上了:AD、ACL’s、Kerberos、加密等等。然而,数据安详的一个方面每每被无视:你怎么知道哪些数据必要护卫?有的人把所有数据都封锁起来,这限制了必要数据的用户获取数据,大幅降低数据的价值。有的人可能会定义他们“认为”敏感的属性,这会使本应被护卫的未知属性处于未被护卫的险境。

      元数据必要打点数据访问权限、获得数据概要成果,数据开发者和终端用户的反响。元数据贮存了定义消费筹备就绪的计谋,并且能够执行这些计谋。没有元数据,数据湖就会无奈使用,并酿成一个重大的安详风险。