社论:澄清数据分析迷思和误解

英特尔首席数据科学家 Bob Rogers 概括了业务用户和决策者对数据分析所持有的常见误解,并解释了这些误解为什么是错误的。

我花了很多时间和英特尔客户及 IT 行业的其他人士就数据分析进行交流,其中出现的一些误解常常让我感到很吃惊。下面是我遇到的六大最常见的“迷思”。

迷思 #1:“要部署机器学习 (ML) 这样的高级分析技术,我们必须大量投资外来的新硬件和专用基础设施。”

真相:您的第一个高级分析项目实际上远比想象的更容易实现

许多公司已经拥有很多可用于高级分析的基础设施。例如,工厂车间布置有数千个传感器很常见,但通常并不会利用所有这些传感器,因为它们产生的数据非常嘈杂。一个很好的起点是,将重点放在确保您的企业能够管理、存储和整合所有数据上。

如果您没有大量现有硬件可用于数据分析,不必担心。许多云服务提供商 (CSP) 可提供现成的高级分析功能。使用这些资源可开展一些试验项目并找到对您企业最有效的应用案例,然后可以制定长期的投资路线图,同时对投资回报情况获得更清晰的了解。

如果选择在内部开展项目,可以使用现有基于英特尔® 技术的平台来帮助您扩展和灵活调整,以一种安全且经济的方式支持您的新项目。

迷思 #2:“我们的企业不需要机器学习这样的高级分析技术。”

真相:无论企业的规模或复杂性如何,每个企业都需要高级分析。

我和客户谈论数据分析时,他们经常会说,他们已经在做这些事了。“太好了”,我说,“请详细谈谈!”然后他们就会开始告诉我,他们如何使用电子表格或简单的在线系统对已经发生的事件进行报告。

这是数据分析之旅中很重要的第一步。您需要知道已经有哪些数据,并在开始分析之前对数据有序地加以整理。但是,随着数据分析功能不断发展,在几年前很有效的商业智能开始就显得有点过时了。

为了紧跟竞争形势,必须认识到数据的实时化趋势,甚至要能使用今天的数据来预测和影响明天将要发生的事情。这正是高级分析技术的用武之地。有了机器学习和其他人工智能 (AI) 技术,您才能更快地了解更多类型、更大数量的数据。例如,AI 有助于自动获取文本和图像中的信息并将该信息应用于业务流程中。有了这样的认识,可以帮助主要决策者更好地开展工作。随着这些功能日益成为主流,如果不接受它们,将很可能使自己处于竞争劣势。

迷思 #3:“我们拥有大量的数据,但数据分析发挥不了什么作用。”

真相:能发挥作用,但清洁的数据非常重要。

企业在运行首个高级分析项目时经常会抱怨,尽管数据堆积如山,但无法从中获得他们想要的洞察。或者,他们实际上得到了错误或不准确的结果。

不幸的是,在许多情况下,忽视数据比寻找问题根源更容易,而问题根源往往就是数据质量问题。关键的一点是,确保能有效地将所有数据收集在一起并进行清理,去除重复和不准确的数据,让数据总是保持最新。人工智能和机器学习算法只能处理提供给它们的数据,所以,低质量的数据就意味着低质量的结果。然而,只要让您的数据管理策略变得合理,获得洞察就没那么难了。

迷思 #4:“我们需要聘用一大批数据科学家。”

真相:您已经拥有这些人了。

作为一位数据科学家,我或许不应该这样说,但并非每个公司都需要专职的、具有博士学位的数据科学家。了解业务需求和供决策者使用的数据本质才是至关重要的。填补数据科学岗位的人选可能很难找,尤其是在一些特定产品或专门领域的专业知识也很关键的行业,所以,只需提供一些额外的工具和培训,您就能拥有所需要的专家。

另一种方法是,向负责业务运营的人员提供用于获取分析驱动的洞察的工具。基于云的服务可以清洁和处理您的数据,并提供创建和呈现洞察所需的算法和仪表板。这些都有助于将您的业务专家转变为大众数据科学家

迷思 #5:“衡量一切才是最好的。”

真相:衡量一切既不可能,也没必要。衡量战略性的事物才是最重要的。

开始收集并整合数据时,您会忍不住试图利用所有事物的全部数据。但是,这样做可能导致工作量庞大无比且费用高昂,而且许多无关信息混杂其中,甚至会对想要的结果带来不利影响。因此,务必要不断地自问,要对什么进行衡量或者分析其某个数据集。如果没有充分的业务理由需要衡量某个事物,可以重点关注其他事物。

客户开始实施高级分析计划时,我们都会建议他们从业务需求开始着手。您想解决什么样的战略挑战?一旦清楚了这一点,就可以设定可衡量的目标,以此作为指导来确定需要衡量什么以及如何确认成功。

迷思 #6:“高级分析意味着我们需要招聘更多 IT 员工。”

真相:您现有的团队就能应对挑战。

如果您已经建立了 IT 团队,就可以在数据分析之旅上大有作为。至于您的 IT 硬件和数据科学技能,在初始阶段主要是最大限度利用好现有的资源。也可能您已经拥有了优秀的 IT 专家,他们乐于抓住机会,引领您的企业实现数据分析创新。

既要重视和依靠您内部已有的技能和专业知识,也要和行业分析师或您信赖的供应商等外部顾问进行合作,以获得他们的建议和最佳实践并确定哪些方面急需培训。如果选择在内部开发算法,可以通过功能即服务 (FaaS) 模式让企业中的其他人员也能利用这些算法,这样有助于尽可能减少长期所需要的开发资源。

很显然,有关部署高级分析这方面仍然有很多问题,但这不应该妨碍您从数据中获取价值。要更多地了解数据分析迷思背后的真相,请观看英特尔和 Fero Labs 提供的视频

做好 IT 转型准备

了解英特尔® 至强® 可扩展处理器如何帮助企业应对当今数字经济的需求。

了解更多

云计算

在当今超级互联的世界中,英特尔的混合云解决方案提供了创新所需的敏捷性和安全性。

了解更多

高级数据分析

高级数据分析正通过全新的发现、更好的体验及改良的产品和服务重塑企业。  

了解更多

英特尔® Select 解决方案

英特尔® Select 解决方案更快速、更自信地部署新的基础设施。由英特尔与合作伙伴联合推出的英特尔® Select 解决方案,基于英特尔® 至强® 可扩展处理器并经过了验证,专为关键的数据中心工作负载而打造。

了解更多

数据中心存储解决方案

随着数据的爆炸式增长,存储的现代化对 IT 转型至关重要。技术进步使数据的存储、访问和传输更有效率。

了解更多