1.让机器学习成为现代化战略的一部分
经过数十年的实验室研究,机器学习现在在现实世界的应用中获得了巨大的关注,这些应用利用技术的强大力量,以高速识别大量数据和多种模式类型:欺诈检测、客户360、面部识别、工作流管理、购物个性化等。
此类举措的回报可能很大。但更大的机会在于创建先进的分析系统,利用机器学习无与伦比的能力来查看、组织和利用对不断增长的大量数据的洞察力,来挖掘大数据和物联网的深刻变革潜力。
为了进入机器学习的下一个阶段,公司必须开发一个合理的商业案例;大规模快速实施机器学习算法;使用配备多个集成内核处理器的系统,更快的内存子系统,并开发能够实时处理大量数据的架构。
对于许多组织来说,现在是建立或开始机器学习经验、加深知识并获得这种复杂数据分析技术可以提供的好处和竞争优势的理想时机。
重要的第一步是认识到机器学习和高级分析是数字革命的基本组成部分。
2.从商业案例开始(从小处着手)
随着公司采用先进的分析技术,IT 应该在最初的研发阶段就让业务决策者参与进来。企业方面很可能已经在考虑获得新见解的方法。许多人将在有或没有 IT 的情况下实施他们需要的分析应用程序和其他解决方案。因此,快速开始合作对每个人都有好处,尤其是机器学习。
该技术可以改进无数的业务流程,带来新的商业模式、产品和服务,并帮助专注于朝着新的、令人惊讶的和盈利的方向发展的最佳方式。业务部门和 IT 部门之间的强大合作伙伴关系将使您更容易筛选出所有诱人的机会。
具有特定商业机会或问题的成功的机器学习计划。例如,英特尔开发了一个概念验证机器学习项目,以识别八个垂直行业中跨越四个地区、使用八种语言的最佳潜在经销商。对这些经销商进行分类,并且他们的资料是通过一种算法建立起来的,该算法会挖掘每家公司的网站内容,用于与客户沟通。这一分析为经销商如何推销自己提供了深刻的见解。由于这些信息,机器学习项目发现了英特尔销售和营销部门还不知道的客户——这是任何组织的首要任务。1
结果是令人印象深刻的。实施机器学习解决方案后,从潜在客户晋升为合格的潜在客户的经销商数量增加了一倍。电子邮件通讯的点击率提高了三倍,目标经销商完成英特尔培训的速度是其他销售渠道的三倍。
从一个定义狭窄的参数的项目开始(这将产生清晰的指标),这可以创造成功,并迅速在整个组织中传播对机器学习的热情,激发人们对更复杂的预测分析使用的兴趣。
3.寻找新的数据源
与其他类型的分析相比,机器学习更依赖于大量的和各种数据源。考虑到需要大量的(通常是非结构化的)数据,确定数据将在何处创建、执行或决定以及存储是至关重要的。
孤立的、不完整的或不正确的数据必须与机器学习项目一起解决。依靠花费时间和精力来删减和清理数据,以减少分析环境中可能降低结果价值的噪音。
然而,机器学习的一大好处是,数据不需要像其他类型的分析那样清晰。另一个优点:机器学习可以增加大数据的数量和种类,发掘比初始结构化数据集更大、成本更低的新资源。
随着公司在机器学习方面取得进展,请仔细分析需要多少数据,以及如何调整和使用当前数据集来最大限度地提高其价值。搜索通常来自公司外部的新数据源,例如有关天气以及人员和产品的位置和移动的精确的信息。
例如,如果广告商可以确定客户正在移动的位置,电话信号不好,天气阴天,他们可能不会接受有针对性的广告。通过即时整合所有这些信息,可以显著改善营销活动。
对数据源的前瞻性方法允许数据科学家可以通过仔细的问题制定、探索性数据分析和数据建模来交付高质量的结果,即使数据质量没有您希望的那么高。
要点是机器学习需要对数据源和使用方式进行广泛的思考。
4.创建端到端的解决方案
为了成功实施机器学习,公司需要一个高度灵活、可扩展的基础设施(包括计算、存储、内存和网络)来开发、训练和部署机器学习和其他高级分析。
与任何分析项目一样,机器学习从现代化开始,包括了解如何在合并或构建新用途时不间断地支持遗留需求。
大规模快速实施的机器学习算法必须由具有多个集成内核、更快的内存子系统以及可以实时并行处理大量数据(例如传感器馈送)的架构的系统提供支持。像 Apache Hadoop 这样的架构可以让公司能够以最原始的格式大规模存储数据,为初始机器学习和训练提供数据点。
对于每一个项目,需要仔细考虑需要培训和处理信息的位置。这将指导有关如何最好地利用现有基础架构以及是否包括基于云的平台或存储的决策。
从端到端架构的角度来处理机器学习可以增加今天成功的机会,同时让公司为未来使用高级分析做好准备。
5.将机器学习纳入到未来分析计划中
机器学习乍一看似乎有些吓人。然而,最成功的实施者将该技术视为通向高级分析的途径。
通常,机器学习将开始专注于运营改进。即使一家公司在该领域取得了进展,它也应该着眼于未来,发展相关技能,同时设想机器学习如何带来新的收入或商业模式。即使在首次涉足该技术时,也要考虑机器学习在未来的优势。
这可能包括获得更多的机器学习技术经验,比如模仿人类大脑运作方式的“深度学习”。如今,深度神经网络(一种前沿的机器学习形式)已被用于图像识别、视频和自然语言处理,以及理解自动驾驶所必需的所有复杂视觉提示。
这种数据使用是公司分析成熟度的关键部分。只有当公司超越传统的商业智能系统时,数据价值才能最大化,因为公司对过去的认识有限。,并采用更高级的分析对未来做出预测,并根据这些预测采取行动。
机器学习将在实现这一目标方面发挥越来越重要的作用。确保机器学习与公司的分析和大数据战略相结合。
英特尔如何帮助您的机器学习之旅
英特尔提供各种资源和技术来创建机器学习和分析所需的稳健的端到端架构。英特尔与顶级系统集成商和技术供应商合作,为您提供用于分布式存储和处理大数据的专有框架和开源框架。
一系列广泛的解决方案为英特尔环境中的机器学习提供支持。SAP、SAS、IBM 和 Oracle 等主要参与者提供了机器学习产品和功能,为开源做出了重大贡献,而 Cloudera 和其他顶级供应商则提供基于云的开源机器学习。
标准系统可用于使用高级软件进行高级分析。随着数据量的增加,一些算法的运行时间呈指数增长,直到它们无法满足客户的要求为止。英特尔通过机器学习框架和算法来帮助解决这个问题。
专用硬件有助于将机器学习提升到一个新的水平。英特尔® 至强融核™ 处理器是英特尔首款专为高度并行工作负载而设计的主机处理器,可支持机器学习所需的规模。 以 AlexNet* 为例,这是一种执行复杂图像识别的神经网络,它将机器学习算法用于数百万张图像以识别其模式。此过程可能需要几天时间。
当机器学习成为企业的当务之急时,公司将需要构建其基础设施来支持数字化企业。
英特尔® 数学核心函数库(英特尔® MKL)和英特尔® 数据分析加速库(英特尔® DAAL)为机器学习算法提供了构建模块,该模块经过高度调整,可在英特尔处理器上实现高性能。