蓝盟IT外包,为人工智能、机器学习和深入学习做准备的数据中心实践

发布者:上海IT外包来源:http://www.lanmon.net点击数:989


Excelero首席技术官Sven  Breuner和首席修订者Kirill  Shoikhet为人工智能、机器学习和深入学习提供了九项更好的实践。
数据点1 :了解目标系统的性能、投资回报和可扩展性计划。
这可以帮助您实现数据中心的目标。 随着人工智能成为核心业务的重要组成部分,大多数组织都从最初的少量预算和少量培训数据集开始,为无缝、快速的系统增长做好基础架构准备。 您需要构建您所选择的硬件和软件基础架构,以实现灵活的向外扩展,并避免每个新增长阶段的破坏性变化。 数据科学家与系统管理员之间的紧密合作对于了解性能要求和了解基础架构可能需要随着时间的推移而发展非常重要。

数据点2 :评价集群的多个GPU系统。


具有多个GPU的服务器可以在系统中实现高效的数据共享和通信,并且经济高效,但是参考设计将来将在群集中使用,并且假定每台服务器最多支持16个GPU。 多GPU服务器需要准备以非常高的速度读取传入的数据,以维持GPU的完全运行。 换句话说,到训练数据库的存储系统为止,需要非常高速的网络连接。 然而,在某些时刻,由于单个服务器不足以在不断增长的训练数据库中工作,因此在配置校正中构建共享存储基础设施将随着人工智能、机器学习和深度学习应用的扩展而容易添加GPU服务器。
数据要点3 :评价人工智能工作流程各阶段的瓶颈。
数据中心基础架构必须能够同时处理人工智能工作流的所有阶段。 在经济高效的数据中心中,可靠的资源调度和共享概念非常重要,因此如果一组数据科学家需要捕获和准备新数据,其他用户将训练可用数据,在其他地方将以前生成的模型用于生产Kubernetes是解决这个问题的主要解决方案,使云计算技术能够在公司内部轻松部署,实现混合部署。
IT外包
>
400-635-8089
立即
咨询
电话咨询
服务热线
400-635-8089
微信咨询
微信咨询
微信咨询
公众号
公众号
公众号
返回顶部