2018来说说机器学习
在开始看整篇文章之前,我希望大家能暂时忘掉那些“机器人偷走了我们的工作”之类耸人听闻的新闻标题。纵观古今,早在农业革命和工业革命之时,人们巧妙地利用工具和不断创新创造更好的生活的愿景推动着历史的车轮滚滚前进。而在二十一世纪的今天,我们正经历着一场“数据革命”,在颠覆过去的同时,全新的工作、全新的业务模式和全新的行业也油然而生。
“机器学习”将成为2018年一项至关重要的技术,在我们生活和工作的方方面面,它发挥的作用或许会比互联网面世以来的任何其它技术都大。像任何新兴技术一样,席卷而来的机器学习已经无处不在:它存在于我们的手机、汽车和家庭的软件当中,帮助我们获取有效信息;它嵌入在我们使用的商业软件当中,让我们更快、更好地做出知情决策。机器学习不但不会威胁到我们的工作生活,反而会让人类变得更加强大、更有效率。
在当下的技术热点话题中,人工智能和自动驾驶几乎占据了半壁江山。机器人和自动驾驶汽车所展现出的智能在令人叹为观止之余,也对其开发和应用带来新的机会与挑战。Gartner 的一份报告也曾指出,到2020 年,人工智能技术将出现在“几乎所有新开发的软件产品”中,这对于软件提供商来说是一个激动人心、甚至可能是决定性的时刻,对于它们的企业客户来说更是一个关键的十字路口。
相比而言,机器学习或许听起来不如以上具有轰动效应,但它却已经深入我们所在的世界,创造着改变。“天下武功,唯快不破”。等待让人落后,任何企业都将无法承受等待的后果。从企业决策时间的缩短及决策有效性的提升上来说,机器学习的建树正是它成为划时代技术的原因。
我们看到,机器学习的发展与云计算的普及几乎同步,其原因在于云应用程序、平台和基础设施的无缝集成将信息孤岛打破,把各个组织及其网络的数据都吸引进来,为机器 学习所用。机器学习的基础是数据的掌握和应用,聚集的数据量越多,它就会变得越聪明,其决策潜能也就越大。甚至,它可以超越人的水平,就像中国的围棋大师柯洁在和机器对弈之后的感慨,人类是会犯错的,而机器不会。
2018年,云技术日益成熟,几乎所有企业都把云作为 IT策略的一部分。云和大数据为企业在数字化转型中提供载体并助力其挖掘价值,机器学习则是第一个从产业意义上大规模运用和放大这些价值的工具。
举例来说,在几乎任何面向客户的行业,海量的客户咨询都可被划分成有限的几个类别,其中许多咨询都可以使用聊天机器人进行预测和回应。聊天机器人正是基于机器学习,才得以不断调试,提升准确回答客户的能力,帮助缩短客户等待时间,提升客服效率。
当然,大家今天看到机器学习产品并不是“智能化、无人化”的全部,如 Oracle 聊天机器人和 Oracle 自治数据库,就像是在今天还买不到无人驾驶的汽车,但如防止追尾、防止偏离道路等一些局部的无人驾驶功能已经实现。
而机器学习的美妙之处在于其用途几乎是无限的。在任何需要快速分析数据和提炼出结论的节点,它都可以发挥作用;在任何需要从大量的数据中识别出趋势或异常状况的地方,它都可以取得令人刮目相看的效果。就像无人驾驶汽车将防止追尾、防止偏离道路等局部应用结合成一个整体,在云计算的平台层,甲骨文也提出了自治云平台的概念,并正在打造一个基于机器学习的、无人干预的云平台,承载众多自动化、自治技术的运用。
毫无疑问的是,探索和释放机器学习的价值将帮助我们在“智能化”“自动化”上走得更远。机器人不会偷走我们的工作,在得以合理和充分有效利用的情况下,技术将永远无法取代人类。
如今,数据浩如烟海、不断累积,对此我们都有耳闻目睹。的确,海量的数据每天都在产生,而这些数据都需要存储、保护和整理。比数据量更值得关注的是数据价值,后者来自数据分析及其中所蕴含的洞察。数据中可能蕴藏着未来的重要商机、推动社会进步以及科学发现的动力。
整个行业都在采用包括基础设施创新、多种工具与手段、以及最佳实践等方法来推动数据分析和挖掘,并取得了长足的进展。但与此同时,这种方式的局限性也正日渐显现。随着数据量和种类的增多,用户期待以越来越快的速度获取数据洞察。为了真正有效利用所有数据,我们必须突破瓶颈,促进数据流动,提升数据的可处理性。
今天,我们将首次深入探讨,英特尔如何凭借英特尔® 傲腾™数据中心级持久内存重塑内存和存储层次结构,为应用开发商和数据解决方案提供商助力。英特尔®傲腾™数据中心级持久内存专为数据中心设计,代表着新一代内存和存储技术。我们相信,这一技术必将彻底消除数据使用的束缚,打破过去50年来影响计算的IO 瓶颈。
不同于传统的DRAM,英特尔 ® 傲腾™数据中心级持久内存将史无前例地集大容量、经济性和持久性于一身。这种新型内存以经济的方式提升了系统内存的容量(大于3TB/CPU),让更大量的数据可以更接近CPU进行移动和保留,最大程度降低从系统存储获取数据的高延迟,从而为最终用户优化工作负载。英特尔的持久内存将提供最高单条 512GB 的存储容量。
数据中心高容量持久内存能够使应用程序在运行时,避免因为经PCIE总线前往存储器而遭受的时延损失。随着开发人员对软件的不断调整,这种新型内存将支持成本效益优越的大容量内存数据库解决方案,提供更长的系统运行时间并加快重启后的恢复速度,从而加速虚拟机存储、为多节点分布式云应用带来更高的性能,并为硬件内置的持久性数据提供高级加密技术。
这一系列收益将对真实场景中的数据中心运营产生重大影响。例如,对于使用 Aerospike* 混合内存架构的NOSQL内存数据库计划内的重启,英特尔® 傲腾™数据中心级持久内存能够实现重启提速——与仅使用DRAM的冷重启相比,它能将重启时间从数分钟缩短到数秒。对于内存密集型工作负载,如 Redis IMDB服务器,英特尔®傲腾™数据中心级持久内存能带来更大的内存容量。因此,与只用DRAM配置的系统相比,它能在同一服务水平协议 (SLA) 性能等级上提供更多的服务器实例。
目前,英特尔®傲腾™数据中心级持久内存已经在客户中引起强烈反响,他们期待运用这项技术来解决现有存储架构存在的容量、性能和时延问题。为了促进这种新型内存的广泛应用,我们已投入数年时间来构建广泛的开发者生态系统,为全球各地的独立软件开发商(ISV)赋能。与合作伙伴的密切配合,我们正在构建并拓展全新一代的应用和服务,以期为数据中心应用带来更多革命性的功能。