在路上——英特尔用普及开始领先HPC
走入会议室的顾凡看起来有一些疲惫。陪同前来的还有他的两位同事,然而他们都很兴奋,因为他们的眼前是最新一期超级计算机Top500榜单的结果,而英特尔刚刚在这份榜单上得到很好的成绩。
这份来自德国曼海姆大学Hans Meuer、美国NERSC/劳伦斯伯克利国家实验室Erich Strohmaier和Horst Simon以及美国诺克斯维尔田纳西大学Jack Dongarra共同编辑整理榜单是所有服务器厂商关注的焦点,原因只有一个,那就是权威性。
用“普及”开始领先
英特尔用系统占有率证明了其领先地位:共有375台基于英特尔架构的高性能计算系统上榜,占全球前500名单总数的75%,相比第30期榜单中70.08%的份额有进一步提升。而在首次引进的能效测试评比中,采用英特尔5400系列处理器的系统占据x86系统能效表现前三名,从而在能效测试的长期拉力赛中赢得起跑。
这个普及不仅仅表现在基于英特尔架构的系统占据了榜上大半江山,在一些细小的分类中,英特尔亦是赢家。除了上面提到的能效测试,Top500中商用系统达到288套,其中有275套基于IA架构,同时,最快的一套也是基于IA架构;四核处理器技术Top500榜单的亮点,基于英特尔四核处理器的系统达到245套,占所有四核系统的51.4%。
然而,这是英特尔用“普及”领先的起步。
在一张PPT中,我们看到了IDC的预测数字:6——64节点的工作组集在07年的获益是86亿美金,而到2012年,这个数字将会增长到140亿美金,涨幅达到几乎一倍;而64节点以上机器则仅仅会从07年30亿美金的获益增长到1012年的39亿美金,相当于没有增长。
顾凡称,在高性能计算领域的金字塔上,中低端应用的基石很小,同时金字塔最顶部的关键计算也很小,英特尔要做的就是如何打造更加强大的基石,同时在顶部做出突破,更多的将高性能的关键技术下移,应用到更多的中低端上去。
高性能市场的趋势
顾凡,这位在英特尔工作了三年、在服务器领域积累了丰富经验的产品经理一开始在沟通会上就给出了高性能计算的趋势:从科研到商用,从Performance到Producive,从高端下降到中低端的普及,infiniband成为主流,中间件和绿色计算的发展以及微软的发展等。
商用成为这次Top500的主旋律。我们可以看到,有57.6%的系统用于商用,而不仅仅局限于科研项目。上述有关金字塔的观点其实也正是商用趋势的证明。顾凡称,在市场趋势中非常明显的现实,高性能计算市场正在从科研走向商用,石油、石化、金融、电信、医学等多个领域都高性能计算的需求越来越大,生命与科学、金融将是下一个高速增长的领域。
他用一个华尔街的例子说明金融行业对高性能计算的需求。当有重要的指数变动或者进行风险预测时,分析师们需要大量的数学建模来模拟可能发生的情况,这些建模不仅数字惊人而且有时间的限制,因此对高性能计算提出了越来越高的要求。
英特尔企业解决方案部石油天然气行业资深企业客户经理杭晓东先生也对高性能计算商用给出了自己的看法,而他针对的是自己更加了解的石油行业。他介绍说,现在石油勘探不仅要求广度,对精确度也有了更高的要求,比如油田的面积或者具体的位置等,叠前时间偏移、叠前深度偏移等一系列高难度问题对高性能计算提出了比较高的要求。
在顾凡的一张PPT中,我们还看到了医疗影像模拟。实际的案例最能说明问题。比如检查癌症。在CT里做癌症的诊断,有50T的容量需要计算2.5个小时,如果到1PFlopS只需要6分钟的时间,那么病人会容易接受,病人对自己是否患有癌症非常关心,6分钟的诊断时间病人可以接受,6分钟的时间段是医学成像这个领域可以接受的。所以需要非常巨大的计算能量。如果可以做到10个PFlop,那就只有40秒,当然在6分钟和40秒两者间你肯定会选择后者。计算能力越强,得到诊断结果的时间就越短,人们当然希望得到判决书的时刻快点到来,高性能计算也会在人们的需求中得到快速发展。
英特尔在高性能计算领域的角色
领导者——这是我们在PPT中看到的字眼。已无需多说,Top500榜单给了英特尔足够的信心说出这句话。无论是从总数上还是从细分的测试中,英特尔都占据了优势。顾凡用胜利油田的案例来说明英特尔对提高运算能力的帮助。顾凡称,英特尔会持续领先,而领先来源于一个公式:
“服务器持续领先=芯片制程工艺+处理器微架构+服务器平台芯片组+生态系统建设+执行能力+工厂网络”。
“英特尔有完整的产品线,无论是至强还是安腾,无论是针对普及应用还是大内存需求这样的个性需求,英特尔的芯片可以完成需求,甚至Many Core这样服务于金字塔尖的产品也即将现身;英特尔还可以提供用于创建、分析和优化和部署集群应用的HPC工具集;我们在美国还有一个非常巨大的高性能计算中心,由软件部门管理,职责就是帮助高性能计算的所有开发商,包括中国行业内部的软件厂商,甚至最终用户做一些分析、调优的工作,因为我们的最新产品都会在这个实验室出现,我们会最先了解行业的应用程序,在这个最新的服务器架构上去调优。”顾凡用一段话介绍了英特尔的优势,但是他要表达的不仅仅于此。
“我们需要OEM一起成长,”生态系统的建设一直都是英特尔长期坚持的事情,“只有这个产业链上的每个环节都是优秀的,这个生态系统才能健康。英特尔要做的是,找准自己的每个市场端的定位,从而提供更好的硬件设计和软件支持。”顾凡如此说道。
“在商用系统中,IA架构是首选。”顾凡用这样一句话说明了英特尔的领先地位。
英特尔将要做的
英特尔从2006年就开始做Tera-Scale的研究,这个单位并不大,T指的是一个芯片要做成提供一个TFlop,并不是说TeraFlop是一个大系统,是一些基本的组件。不仅如此,英特尔还要在能效比上下功夫,尽管现在这已经是他们的强项。
英特尔还有一个最新的计划是Intel Cluster Ready,这个计划只有一个目的,就是让高性能计算普及如何解决高性能计算无数的硬件和软件甚至操作系统中间件这些插件之间的组合和兼容性,让客户做到一站式采购,简化HPC系统和软件的部署,这是英特尔Intel Cluster Ready的使命。当然英特尔在Server Building Block也做了很多工作,比如为新用户定制服务器,比如大家熟知的一款高密度服务器,在1U的空间内可以有两个两路服务器的地方来做到更高密度的计算。
关于多核的问题顾凡介绍说,英特尔一直坚信高性能计算一定会走向多核化,并且一定是等大的核,不是小核,这个核的指令集、计算、管道都不用那么复杂,会更倾向于未来更轻量小核,达到并行化,带来的是能量的节省。摩尔定律赋予英特尔的能力,是可以选择做大核还是小核,而英特尔的选择是轻量级的小核,这是未来的一条必走之路。但是一定要配合软件的并行化。
当然并不是核越多是越好。核到16个以上,如果没有新的技术,没有其他技术辅助的话,性能会下降,单纯靠核的性能会下降。一定有其他技术辅助,因为当核心非常多的时候,并行任务分配,处理器太快了,可是串行永远改变不了,核太多,串行会拖后腿。要考虑平衡。英特尔会有其他的技术,像硬件一级的线程调度,缓存一致性的改进,以及会不会有新的指令集加入进去,帮助整个的多核处理器并行化的平衡。其实,16核以后核的性能降低,依托辅助的技术帮助达到未来核多之后仍然是在一定的能效范围内性能继续增长。
“光靠多核完全不能走向未来的千万亿次。市场中的人一定要有能力做平台方面的研发,软件方面的尝试和突破,这正是英特尔今天的核心价值所在。”顾凡用这句话结束了对多核的讨论。
不难看出,在未来英特尔的愿景是,将高性能计算从实验室中解放出来,应用到更加广泛的商业计算中去;将高性能计算从金字塔尖上解救出来,进入到更加广阔的中低端应用中;将高性能计算摆脱高能耗的“恶名”,走进绿色计算……而其中有一些他们已经做到,另外一些,他们正在路上。
搜索更多相关主题的帖子:
高性能计算