|
|
|
|
移动端

英特尔马子雅:深度学习四大痛点与BigDL解决之道

英特尔与Cloudera深度合作,在软件方面进行了全面优化。优化之后,Hbase非堆存储读操作性能提升了5.6倍,在没有增加任何硬件成本的情况下,阿里巴巴在“双11”时把HBase的Throughput提升了30%,吞吐量提升了30%。此外,把MKL应用到用户Spark机器学习的工作负载中,并实现了4.3倍的性能提升。

作者:ZC来源:51CTO|2017-07-21 13:02

【新品产上线啦】51CTO播客,随时随地,碎片化学习

【51CTO.com原创稿件】在万物智能互联时代,数以亿计的智能互联设备及其产生的数据洪流带来了产业的数字化变革。越来越多的企业希望借助机器学习与深度学习,从海量数据中获取切实可行的洞察以指导企业决策、创造更多价值。借助计算、存储和网络等基础设施的优势,英特尔在数据分析与人工智能领域深耕已久,并通过与合作伙伴的合作,给用户提供了端到端的软硬件全平台解决方案。近期,由O'Reilly Media和Cloudera联合举办的Strata Data Conference大会在京召开。期间,笔者受邀采访了英特尔公司软件与服务事业部副总裁、系统技术和优化部门大数据技术总监马子雅,英特尔大数据首席架构师、资深首席工程师戴金权,Cloudera联合创始人兼首席技术官Amr Awadallah,以及Cloudera 大中华区总经理、公司副总裁凌琦,就英特尔与Cloudera在数据分析和人工智能方面的合作话题进行了探讨。

倍数提升的数据分析性能

7月12日,英特尔正式推出了至强可扩展处理器,由于采用全新的内核微架构、核内互联和内存控制器,因此基于至强可扩展处理器的平台提供了更加优化的数据中心和网络基础设施所需的性能、可靠性和可管理性,使得企业获得更高性能,将洞察付诸实施、实现业务连续性,并满足实时服务交付方面的需求。

英特尔提供的数据显示,与上一代产品相比,英特尔至强可扩展处理器的整体性能提升达1.65倍,OLTP仓库负载比当前系统提高达5倍。借助英特尔AVX-512以及集成英特尔OPA端口,英特尔至强可扩展处理器可将每秒浮点运算性能最高提升到2倍。相比上一代产品,英特尔至强可扩展处理器的大数据工作负载基本性能提升了2.7倍,针对深度学习训练和推理可提供高达2.2倍的性能。结合可加快交付人工智能服务的软件优化,相比3年前未经优化的服务器系统,全新的处理器可实现113倍深度学习性能的提升。

除了硬件升级之外,英特尔与Cloudera深度合作,在软件方面进行了全面优化。优化之后,Hbase非堆存储读操作性能提升了5.6倍,在没有增加任何硬件成本的情况下,阿里巴巴在“双11”时把HBase的Throughput提升了30%,吞吐量提升了30%。此外,把MKL应用到用户Spark机器学习的工作负载中,并实现了4.3倍的性能提升。

英特尔公司软件与服务事业部副总裁,系统技术和优化部门大数据技术总监马子雅表示,英特尔通过硬件升级和软件优化来帮助推进技术民主化,至强可扩展处理器已经正式推出,硬件升级已经完成。通过与合作伙伴的合作,对软件进行全面优化,性能和性价比都有了前所未有的提升。并且,英特尔已经将所有的软件优化代码全部贡献给了开源,并包含在最新的Cloudera发行版中。

深度学习存在着四大痛点

很多用户认为深度学习的主要痛点是性能,只要有足够强大的性能,即可以解决深度学习存在的各种问题。在马子雅看来,性能并非深度学习的主要痛点,用户的真正痛点主要有四个方面。

一是如何利用已有的海量数据分析平台,比如Hadoop、Spark,或者是跟已有的分析应用程序直接结合,而不是单独作为一个分开训练的功能存在。

二是如何将深度学习在一个集群上进行扩展,不是在一个或者两个分布式的节点上。这也是当前许多软件公司开始把Spark跟Caffe、TensorFlow进行结合,把已有的深度学习框架跟Spark可扩展性结合到一块儿,来解决高效可扩展性痛点。当然,由于 Caffe、TensorFlow并不是为扩展性设计的,也不是为Spark设计的,当把两个方案结合到一块儿时,根本无法实现数据并行跟模型训练并行,只是表面把这两个产品黏合到一块儿去,根本无法做到真正的分布式的深度学习的功能。

三是如何解决深度学习高昂代价的问题,用户不希望部署一个非常昂贵的新集群,而是利用已有集群添加深度学习功能。

四是如何用高性能来缩短模型训练的周期。

基于以上四大痛点,英特尔推出了BigDL。BigDL是在Spark的基础上构建了分布式深度学习的框架,将以往的深度学习框架同Spark结合之后,优势非常突出。

首先,BigDL深度学习功能与已有深度学习框架功能完全一致,例如Caffe、Torch、TensorFlow等,功能相当丰富。第二,BigDL能够无缝与Spark和Hadoop进行结合,直接在大数据平台中应用。第三,BigDl能够利用Spark的可扩展性做到数据并行,拥有强大的可扩展性,可以在一个集群上进行扩展,并且非常容易扩展到上百个节点。第四,低成本。由于可以利用BigDL在已有的集群上直接生成深度学习,所以成本非常低。最后,高性能。通过利用英特尔优化过的数学核心函数库和多线程优化方法来提升BigDL的性能,特别是在至强服务器上,性能优势非常明显。

马子雅表示,今年第一季度,BigDL已经发布了一个版本,第二版本将会在今年7月推出,与第一版本相比,它在Python API的支持,尤其是对支持载入Caffe、Torch、TensorFlow的预训练模型上有了很大的提升。另外,在用户体验,包括提供一些更丰富的RNN的支持上,第二版本将会更加全面。

深度合作推动人工智能落地

英特尔与Cloudera主要在三个方面达成了深度合作,一个是英特尔将会与Cloudera共同进行软件优化,并利用英特尔最新的硬件技术来做一些合作。二是在开源方面英特尔与Cloudera的所有合作都是最先到开源,贡献给开源。之后Cloudera会把功能从开源里再放到自己的解决方案和产品当中去。三是共同合作项目,一起帮助用户解决问题。

Cloudera联合创始人兼首席技术官Amr Awadallah表示,Cloudera数据科学平台是一个非常好的深度学习解决方案,完美满足了不同的甚至是相互冲突的诉求。数学科学家利用Cloudera平台编程,开发诸如Spark或者是Python等等不同的语言,并能够加入一些新的库,例如TensorFlow和BigDL。他表示,目前正处在人类历史上最伟大、最重要的一次转型,那就是决策的自动化,它的重要意义绝对不会弱于先前出现的工业革命,Cloudera和英特尔密切合作共同推动浪潮向前发展。

马子雅表示,英特尔在数据分析应用和人工智能方面的承诺从来没有改变,我们希望给用户最佳的用户体验。一是通过硬件的升级和软件优化来推进技术民主化;二是为新兴的需求提供新兴的解决方案;三是跟用户合作,推动创新,为用户解决最新、最复杂的问题,来帮助用户最大化其商业价值。

【51CTO原创稿件,合作站点转载请注明原文作者和出处为51CTO.com】

【编辑推荐】

  1. 英特尔&九州云99Cloud OpenStack行业应用研讨会
  2. 英特尔首批3D XPoint存储产品出货 速度是闪存的千倍
  3. 在云端数据分析应用落地上,英特尔与金山云联手迈出重要一步
  4. 英特尔+Ceph加速企业存储现代化的有效利器
  5. 英特尔Michael Greene:联合Ceph社区和合作伙伴,推动存储性能优化提升
【责任编辑:张诚 TEL:(010)68476606】


点赞 0
分享:
大家都在看
猜你喜欢

热门职位+更多

读 书 +更多

跨越网络工程师必备训练

本书是根据全国计算机技术与软件专业资格(水平)考试“网络工程师级考试大纲”编写的考试辅导用书。全书主体按考试大纲的章节编排,分上、...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊