预测数据与分析 — 这是什么?为何重要?
了解预测分析如何帮助组织在数据驱动型企业新时代打造竞争优势。
什么是预测分析?
设想一下,您所掌握的数据并未得到充分利用。这不仅是指通过标准客户交易生成的数据,还包括从社交媒体、Web、语音文件和图像文件这类非传统来源收集到的数据。现在,无论是结构化数据还是非结构化数据,您都可以随心掌控,利用它们来获取竞争优势。要提取相关见解,要点之一在于分析 — 尤其是预测分析。
预测分析是指一种数据利用流程,依托您所在组织创建和收集到的各类数据提炼出对可能发生的未来结果的见解。请注意“可能发生的”这个词。预测分析能够帮助用户根据运行假设情况并利用现有数据评估事件发生的可能性,来预测未来在合理范围内会发生什么事情。
人们将预测分析视为一种高级分析技术。高级分析方法不同于传统分析方法,前者可以帮助企业展望未来,而不是回顾历史。因此,您不该问“发生了什么?”, 而是应该问“可能会发生什么?”。例如,这部电梯是不是还另外需要 50 个小时的维修时间?或者甚至随着您在分析方面的经验和专业知识技能不断积累,您可能会问“我们应该做些什么来解决这个问题?” 再或者,更令人兴奋的是,当您精通高级分析知识之后,您会信任自己选择的系统:由系统来分析数据并采取最适合我的业务的措施。
分析部署通常对应着一条由五个阶段构成的成熟度曲线。传统分析仅包含这条成熟度曲线上的两种分析,高级分析则包含这条曲线上的剩下三种分析。
组织如何通过预测分析受益?
时下有许多企业都渴望从传统商务智能 (BI) 转型至预测分析这类高级分析技术。
但预测分析究竟能为贵公司做些什么?
能做很多事情。终于,您可以实时利用快速增长的结构数据和非结构数据了,借此您不仅可以解答关于人事、定价以及库存管理方面的业务问题,还能解答诸如数据中心正常运行时间和 SLA 这类运营问题。
两个现实示例:
- 有一家大医院近期受到规章制度变更的影响,需要设法降低患者再次收治入院的比例,于是建造了一个预测分析模型。该模型采纳了新数据和不常见的数据(无论是患者贫困、文化水平低下、英语水平有限、在家很难得到社会支持、生活条件差,还是其他各种原因),并将其与患者的电子医疗记录进行组合,从而判断患者是否很有可能再次入院。通过找到目标患者并给予更多的护理,医院显著降低了患者再次入院医治的比例,在避免遭受数百万美元罚款的同时释放出资源来医治更多患者。1
- 一家大型服装零售商为其产品打上 RFID 标记,然后通过能以近乎实时的方式全面查看库存信息的预测分析模型来跟踪相关数据。该模型能向商店预告需要在货架上添置什么款式和尺寸的商品(便于进店的顾客找到他们想要的物品),以及某些商品的销售“热点”和最佳销售时机。结果,不仅店铺销量上升,该零售商还能更有效地跟踪和补充库存。
什么是最佳的预测分析基础设施?
每种分析技术都有其独特的一套基础设施要求。首先,您要观察自己现有的基础设施。分析您的计算、网络和存储功能是在什么环节跟不上需求变化,阻碍了您的业务发展。
要进行预测分析,您需要保证基础设施满足现代化要求,以便交付所需的性能、安全性以及内存或存储效果。您的基础设施必须足够灵活才能运行商业预测分析解决方案和开源预测分析解决方案,并提供充足的成长空间 — 仅以线性方式增长是不够的,基础设施可能必须以超出正常预期的规模成长,才能满足您的需求。
基础设施应可运行多种分析工作负载 — 从实时、内存 SAP HANA* 或 Oracle* Exadata* 数据库到流数据分析(Storm*、Flink*)和大数据 Hadoop* 部署。眼下,您可能想构建一个 Hadoop* 数据湖,但今后您需要的可能是一个独立的 Spark* 环境。您的基础设施必须足够灵活才能满足这两方面的要求。
别忘了考虑云环境。如果您的目标是实施大规模预测分析,那么,云计算和云存储功能可以为您扩大基础设施,使您能根据需要实现本地增长和异地增长。对于目前尚不在您计划内的基础设施或平台解决方案,云环境还可帮助加快这类解决方案的部署。
要想实现所有这些目标,请选择符合行业标准的基础设施组件,但千万不要认为这样做就可以一劳永逸。这只不过是最低标准。此外,还需针对预测分析工作负载对您的组件进行测试和优化,例如,不要拘泥于一般的处理器功能,您需要的是您可以进行定制的 FPGA,从而为目标分析工作负载、内存、存储、以太网、互联构件以及专为进行深度学习而优化的各种平台加速。
英特尔的分析产品
英特尔® 固态硬盘数据中心家族
利用最出色的数据中心存储解决方案,消除瓶颈问题。实现基础设施现代化,不断满足数字化业务的需求。适用于数据中心的英特尔® 固态硬盘经过优化,可提供极高的性能、可靠性和耐用性。
开放源代码是怎样在预测分析中发挥作用的?
您可以在不评估开源工具的情况下部署预测分析,但这样容易出问题。开源分析社区的覆盖广度和深度都很具规模,该社区有一套高级分析工具明星产品组合,从 Hadoop* 到 Spark* 再到 Hive*,此外还包括很多正在通过全球开源社区进行改进完善的其他品牌产品。
从表面上看,比起专属分析平台而言,开源预测分析工具能大幅降低部署成本。这使得它们颇受刚刚涉足预测分析领域的公司的青睐。这类工具相当灵活,能为您提供适合多种分析工作负载的大量部署选项。
然而,正是这一非同一般的灵活性让他们在使用工具时遇到不少困难。如果选择开源方案,您就需要具备相关新兴技能和高级技能的人才,比如数据科学家、数据工程师以及数据分析师。您可以选择招募这样的人才,也可选择培养内部员工,等待他们掌握相关知识技能,但第二种方案相当费时。许多公司最后都选择聘用顾问,这无疑就增加了开源计划的成本。
有些公司会选择通过开源方式对预测分析系统进行概念验证 (POC) 测试,然后在生产中使用专属解决方案。不过,由于开放源代码给了公司们利用所有结构化数据和非机构化数据的机会,并且支持企业测试各种令人兴奋的新分析概念,因此这种方式逐渐在生产解决方案中发挥出越来越重要的作用。于是,这种情形往往就促成了开源技术与专属技术的融合,能让您针对不同工作挑选最合适的解决方案,然后进行有机组合,实现最佳结果。
在组织内打造预测分析业务案例
阻拦预测分析技术得到采用的最大障碍之一就是评估所提议的活动将会为您的企业创造多大的价值。
您知道您的 BI 解决方案目前具有重要价值是因为您已经无法离开它。但如果是要您确认预测分析的价值呢?首先,您必须证明构建新的基础设施、招聘专业人才或培养员工技能,以及购买分析平台或工具需要在前期花费多少资金。您必须证明这项投资将可为您的企业创造前瞻性价值,而不是对已经发生的事情进行归纳总结,毕竟传统分析技术在过去十年间就已经能够提供这种总结能力了。
要确保投资物有所值,首先要遵循的规则是:与企业密切相关。预测分析无法孤立存在。您选择这项技术是为了解决业务问题。请询问您的业务用户,确定可以通过预测分析解决哪些痛点问题。选择一个他们一直设法解决,但目前超出了您现有数据源和分析系统能力的难题。或者选择一个由于数据源为全新,并且没有接受过测试或是属于非结构化数据源,而导致的过去从未考虑过解决的新问题。
第二条规则是从小处着手。预测分析势不可挡。毕竟,这是一个每天都在变化的复杂领域。新解决方案和新工具源源不断地涌入市场(尤其是在开源领域),但所有这些内容彼此之间如何集成目前尚不明确。同时还需考虑到数据安全注意事项。
问您自己几个基础问题:我究竟想为企业实现怎样的目的?较之传统分析,预测分析将如何为我提供更多见解?我所需的数据是否可用,这些数据能否带来业务竞争优势?预期的 ROI 是什么样的?
与英特尔合作有什么好处
英特尔一直致力于推动技术创新,帮助您借助预测分析技术取得丰硕成果。英特尔® 技术涵盖了基础设施的每一个方面,旨在帮助企业利用预测分析来创造竞争优势。
需要特别指出的是,英特尔为全世界定义了能促进计算、网络和存储技术发展的各类标准,并积极推动这些标准逐步完善。英特尔的创新技术均已针对业内覆盖面最广的预测分析解决方案生态系统进行了测试和优化,支持适用于多种工作负载(无论是在开源平台还是在专属平台上运行)的预测分析型基础设施。由于新的预测分析平台全部基于英特尔架构,因此,您可以在平台上的任何位置执行分析操作,从而使分布式分析技术也能融入到每一项部署当中。
在计算方面,英特尔® 处理器完全能满足各类预测分析需求。该产品组合超出了通用型英特尔® 至强® 处理器的范畴,延伸到多项重要辅助技术领域,比如用来为分析工作负载、内存、存储、以太网和互联构件进行加速的定制型 FPGA。
如果您为了进行预测分析而打造现代化的存储,英特尔技术将为您带来突破性的应用性能,使数据更快地转化为见解。英特尔存储解决方案旨在借助英特尔® 处理器、芯片组、固件、软件和驱动程序实现无缝性能表现与增强的功能,能很好地兼顾速度、低价和性能需求。
英特尔对预测分析的联网也能发挥助力。将数据湖或仓库中的数据移至计算基础设施时如果出现延迟,则会增加实时操作的成本。为了帮助您的组织避免遭遇这类延迟现象,英特尔提供了市面上现有速度最快的架构之一,从而跨不同网络通道为预测分析工作负载加速。
同时要重视的还有安全问题:英特尔硬件和软件安全工具有助于保护访问安全,以及静态数据和移动数据的安全。
点击此处了解更多有关英特尔如何支持贵组织的预测分析战略的内容。
利用我们的高级分析生态系统
Microsoft
Windows Server* 2016 通过灵活且经济有效的软件定义计算、存储和网络功能来实现数据中心的各项高级功能。它针对英特尔的技术进行了优化,可提供出色的性能、优化、效率和可扩展性。