发布者:上海IT外包来源:http://www.lanmon.net点击数:1967
蓝盟IT小贴士,来喽!
MLOps还是个新概念,但人们的需求越来越高。 2018年左右,在谷歌发表演讲后,业界专家首次公开了工业运行(生产)中机器学习生命周期集成化管理的必要性。
将机器学习模型引入实际业务的实践不限于数据准备、开发、神经网络和其他机器学习算法的训练方面。 从数据集验证到在可靠的大数据生产环境中测试和部署数据集,产品解决方案的质量受到很多因素的影响。
大数据的新范式:什么是MLOps?
也就是说,预测或分类的实际结果不仅取决于数据科学家提出的神经网络架构和机器学习方法,还取决于开发团队如何实现这个模型以及管理员如何在集群环境中引入这个模型。 输入数据质量和接收数据的来源、通道和频率也很重要,这是数据工程师的责任范围。
在机器学习解决方案的开发、测试、部署和支持过程中,多个领域的专家在交互中面临许多组织挑战和技术障碍,不仅延长了产品的制作时间,而且降低了产品给业务带来的实际价值。
为了消除这些障碍,产生了MLOps这个概念。 与DevOps和DataOps一样,MLOps的目的是提高自动化程度和工业机器学习解决方案的质量,同时兼顾法规要求和业务利益。
因此,MLOps是将包括集成、测试、公开、部署、基础结构管理等操作在内的系统开发和运用支持相结合,实现机器学习系统的生命周期复合化和自动管理的文化理念和应用实例。
MLOps可以用敏捷的方法和技术工具扩展CRISP-DM方法论(CRISP-DM行业间数据挖掘标准流程),自动化包括数据、机器学习模型、代码和环境在内的操作。
这些工具包括Cloudera公司的数据科学工作台—— clouderadatascienceworkbench,实践MLOps有助于在CRISP-DM的经典阶段避免常见陷阱和问题。
MLOps给商业和数据科学带来的十大好处
在实施MLOps的所有好处中,最突出的是机器学习工业引进细节中的敏捷方法。
通过可靠性和有效的机器学习生命周期管理,缩短时间,取得高品质的结果。
持续开发(CD )、持续集成(CI )、持续训练(CT )方法和工具保证了工作流和模型的重复性。可以随时随地简单地引入高精度机器学习模式。
综合管理系统可以连续监视机器学习资源。
消除组织障碍,凝聚多学科机器学习专家的经验。
因此,使用MLOps可以优化以下机器学习操作:
统一机器学习模式和相关软件产品的发布周期。
自动测试机器学习组件,包括数据验证、机器学习模型本身测试和集成到产品解决方案中。
在机器学习项目中实践敏捷原则。
在CI、CD、CT系统中支持机器学习模型和数据集。
运用机器学习模式减轻技术债务。
大数据的新范式:什么是MLOps?
值得注意的是,MLOps的实践应该与语言、框架、平台和基础架构无关。 技术上,MLOps系统的整体架构包括大规模数据平台的收集和汇集、用于机器学习的建模分析和准备数据的应用、执行计算和分析的工具、与机器学习模型及其生命周期相关的数据
这样,数据科学家、数据工程师、机器学习专家、大数据解决方案的设计者和开发人员以及使用统一高效管道的DevOps工程师的工作任务有望部分或完全自动化。
文/上海蓝盟 IT外包专家
分享到: