蓝盟IT外包,如何选择最适合你的数据目录

发布者:上海IT外包来源:http://www.lanmon.net点击数:1013


为什么数据目录很重要
Gartner高级研究主管Joe  Maguire认为,企业对数据目录工具的需求主要来自三个方面。
企业使用数据目录的首要驱动因素是元数据管理越来越难。 数据架构更复杂,数据量太大,无法手动收集和描述元数据。
Maguire说:“即使是旨在简化模式的技术(例如,数据湖提供了用于存储各种数据的单个模式组件),元数据管理也可能会变得复杂。”
面对数据量的增长,一些公司没有扩大元数据管理。
Maguire说:“由于无视数据湖的元数据,人们不得不创造‘数据沼’这个术语来描述数据混乱、谁也无法清理的数据湖。”
第二个因素是,随着企业追求自助分析和数据科学,对数据管理的需求也在增加。 结果,对数据目录的需求也越来越大。 元数据是便于访问元数据的数据治理的基础。
第三个因素是这个市场证明了自己的价值。 供应商的产品越来越多样化,真正帮助了需要数据管理和元数据管理的企业。 元数据自动发现、数据沿用、数据管理活动支持等功能,使数据目录对企业极具吸引力。
数据目录的类别
根据Maguire的说法,研究数据目录时最重要的区别是了解企业数据目录和嵌入式数据目录的区别。
Maguire说:“企业数据目录的目的是整合来自各种元数据岛的元数据。 嵌入式数据目录是其他产品提供的一组元数据管理功能。 ”。
企业数据目录选项可以是DBMS、数据仓库或BI平台。 嵌入式数据目录构成了元数据岛。 企业数据目录正在整合的元数据岛。
最常见的数据目录包括:
独立的数据目录。 这些数据目录具有通用性、独立性和业务导向的特点,可以广泛用于数据管理、分析和数据管理。 此选项适用于需要对多个用例进行数据分类的企业。 目前,提供独立数据目录的供应商有Alation、Collibra、Informatica和Data.World。
提供目录功能的元数据管理工具。 现代数据目录主要面向数据管理员和数据分析师,可以自动执行元数据管理任务。 Gartner在最新的关于扩展数据目录的报告中警告说,一些供应商已将元数据管理工具重命名为数据目录。 你应该自己研究,选择正确的工具。具有数据目录功能的Data  Lake支持工具。 随着企业继续构建数据湖,将需要可搜索、可重复使用的数据。 结果,供应商将数据目录添加到产品中。 Zaloni和cloud  era导航器都属于这个类。 对采用数据湖感到恐惧的企业可以考虑这些供应商。
一旦公司决定选择企业数据目录或嵌入式数据目录,就可以继续寻找功能。 好的数据目录应该提供很多功能。
好的数据目录应该提供什么?
作为企业,应该由你的团队决定哪个产品与你的数据最相关。 供应商数据目录有几个共同的特征,需要首先评价质量。
数据目录的重要功能在于其搜索功能。 如果没有灵活的搜索和筛选选项,用户将无法找到数据项目和用于分析目的的数据集。 数据目录还需要从大量相关数据资产中收集元数据。 此外,还必须提供自动化和数据智能,以处理与数据目录相关的手动任务。 人工智能和机器学习可以通过推荐来增强数据。
数据目录还必须能够连接到企业中数据架构的各个组件。 Maguire说,企业数据目录可以看作是元数据的数据仓库。 数据目录将元数据从元数据孤岛合并,就像数据仓库从数据仓库孤岛合并数据一样。
数据目录的另一个重要功能是提供用于从DBMS、BI工具和数据仓库等各种组件检索元数据的连接器。 数据目录支持以下四种类型的元数据:
描述数据模型、存储模式、文件布局和API的技术元数据。
描述由数据的继承、性能和对数据的各种操作生成的日志文件的输出的操作元数据。
业务元数据分为两类。 一个是记述业务的元数据,例如业务数据词汇表的内容。 另一个是解释业务角色(如数据管理员、数据保管者和自助分析师)如何与数据资产进行交互。 数据管理员负责特定的数据资产。
社会元数据构成知识,如特定数据资产的证明和授权,或其他用户对数据目录中的条目生成的注释。
普通供应商

市场上有许多公司和嵌入式数据目录,这些选项通常具有类似的功能和重叠功能。 以下是数据目录选项的简单比较。

文/上海蓝盟   IT外包专家

IT外包
>
400-635-8089
立即
咨询
电话咨询
服务热线
400-635-8089
微信咨询
微信咨询
微信咨询
公众号
公众号
公众号
返回顶部