蓝盟IT小贴士,来喽!
在能够学到许多不同的数据源的情况下,采用人工智能和机器学习技术是最有效的。 数据科学家利用这些丰富的数据训练领域模型。 “五大数据v”(数量、类型、速度、准确性和价值)中,前两个(数量和类型)最重要。 简言之,人工智能和机器学习依赖于大量不同的数据(图像、文本、结构化、半结构化数据)构建有用的模型,提供准确的结果,最终提供商业价值。
对象存储是一种可扩展的存储体系结构,尤其适合于支持人工智能和机器学习所需的大量数据。 对象存储旨在以水平扩展方式实现无限的增长,使公司能够在需要的位置和时间添加更多节点以增加部署。 由于对象存储使用单个全局命名空间,因此可以一次在多个地理位置进行此扩展。 另一方面,文件和块系统通常采用扩展方法。 也就是说,这些平台通过向单个节点添加计算资源来实现垂直扩展,最终受到约束。 不能部署其他节点来增加计算资源,也不能有效地扩展。
强大而灵活的数据API对于人工智能和机器学习至关重要,并且如上所述使用了各种数据类型。 存储平台必须支持用于存储各种数据的API。 此外,人工智能和机器学习的创新越来越普遍,但仍有相当一部分人工智能和机器学习发生在数据中心和私人云中。 这取决于用例的具体情况(例如,科学研究、医疗等领域最适合私人云)。 这意味着组织需要支持公共云和本地/专用云工作负载的存储API。
文件和块存储平台支持的API受旧体系结构的限制。 相反,对象存储使用特定于云平台的高级API。 此API以应用程序为中心设计,支持多种API,包括版本控制、生命周期管理、加密、对象锁定和元数据。 您还可以使用新的对象存储API来支持人工智能和机器学习用例,包括对流数据支持和大型数据集查询支持。
与API一样,利用人工智能和机器学习的组织必须利用无限的可定制元数据是非常重要的。 元数据是关于数据的数据,在最基本的层面,是何时何地制作的数据,是谁制作的数据。 但是,元数据可以描述更多的内容.包括: 用户可以创建任何元数据标记来描述他们想要的属性。数据科学家为了构建和使用人工智能和机器学习模型,需要大量元数据来查找特定的数据。 随着向数据添加更多信息,元数据注释能够逐渐积累知识。
文件和块存储仅支持有限的元数据,如上述基本属性。 由于文件系统和块系统没有快速、无缝的扩展功能,因此如果存储系统支持大型数据集相关的人工智能和机器学习应用程序的丰富元数据,则这可以极大地影响可扩展性。 然而,目标存储支持无限数量的完全可定制元数据,使得用于人工智能和机器学习算法的数据搜索更加容易,并且可以从中获得更好的见解。
文/上海蓝盟 IT外包专家