发布者:上海IT外包来源:http://www.lanmon.net点击数:1078
蓝盟IT小贴士,来喽!
人工智能和机器学习已经成为企业最重要的两个工具,有助于企业利用其核心数字资产创造竞争优势。 但是在采用人工智能数据存储之前,企业必须考虑机器学习平台如何获取、处理和保存数据的一系列要求。
首先,检查机器学习软件使用的数据的生命周期。 这有助于了解企业在为人工智能选择存储时应考虑的问题。 最初企业为了训练机器学习和人工智能算法必须取得数据。 它们是处理数据和学习任务的软件工具,包括标识对象、处理视频和跟踪运动。 数据可以从不同的源生成,通常不是结构化的,例如对象或文件。
在培训过程中,您可以获取数据资产,并创建算法来使用机器学习或人工智能软件处理未来的数据源。 在培训或开发算法时,人工智能软件处理源数据,开发能够创建洞察力或满足业务需求的模型。

开发机器学习算法不是一个过程。 随着企业积累越来越多的数据,其算法也得到完善和改进。 这意味着大多数数据不会丢弃,而是随着时间的推移而增加和重新处理。
采用人工智能数据存储标准
在为人工智能平台选择存储之前,企业必须首先考虑以下事项
(一)费用。 人工智能数据存储的价格是企业考虑购买的重要因素。 显然,参与企业管理层和采购决策的人希望数据存储尽可能经济高效,这往往会影响企业的产品选择和战略。
(2)可扩展性。 企业为了制作机器学习和人工智能模型,有必要收集、保存和处理大量的数据。 机器学习算法要求源数据以指数方式增加以实现精度的线性改进。 创建可靠、准确的机器学习模型可能需要数百TB到数PB的数据,并随着时间的推移而增长。
构建PB级存储系统通常意味着使用对象存储或向外扩展文件系统。 现代对象存储可以解决人工智能工作负载的容量要求,但可能无法满足其他条件,如性能。 向外扩展文件系统可以提高性能和可扩展性,但将整个数据集存储在一个平台上可能会增加成本。 由于可扩展性要求和大容量产品的成本,块存储通常不是机器学习和人工智能的正确选择。 唯一的例外是在公众云层中。
存储成本的变化引入了分层和使用多种类型的存储来存储数据的想法。 例如,对象存储库是存储大量非活动人工智能数据的好目标。 如果需要处理数据,可以导航到高性能文件存储群集或对象存储中的高性能节点,并在处理完成后返回数据。
蓝盟专业IT服务18年
分享到: