1965年,新中国宣布研制第一颗人造卫星,然而摆在工程师面前的第一道难题,是如何计算天文般繁多的数字。当时的中国的计算机技术很落后,用的最好的计算机也就是飞鱼牌手摇计算机,计算能力有限。所以,工程师们选择了用算盘这种古老的工具,古老的算盘实现古老的飞天传说,听起来有些浪漫,实际上满是艰辛。为了加快进度,年轻的工作人员不得不一天三班倒,处理大量的计算数据,在这样落后的手段下,单是精确地计算出一条一条轨道的运行轨迹就得花上一年时间。
1978年,改革开放刚启程,邓小平提出“中国要进入四个现代化,不能没有巨型机”点名让国防科委负责研发。长沙工学院计算机系首任主任慈云桂教授立下军令状:5年时间,一天不多;每秒一亿次,一次不少,就算是豁出这条老命,也要把中国的巨型机搞出来!
(中国超算之父慈云桂)
抱着不甘人后的信念,以慈云桂为代表的科研团队,参考当时国际上先进巨型机的设计思路,集智攻关,创造性地为巨型机设计了一个“双向量阵列”体系结构,攻克了一个个技术难关,提前一年完成了研制任务。
1983年12月,我国第一台亿次计算机研制成功,正式通过鉴定,取名为银河一号。时任国防科工委主任张爱萍为银河一号提了一首诗:“亿万星辰汇银河,世人难知有几多。神机妙算巧安排,笑向繁星任高歌。”这首诗道出了无数科研人员研制超级计算机的艰辛历程。银河一号的成功,使得中国成为继美、日之后第三个能独立设计和制造巨型机的国家。
超级计算机不是面子工程,是切切实实的用在实地的国之利器,银河一号的发明解决了当时我国石油物探的大问题,银河一号被石油部物探研究院,用作石油地震物理处理系统。随后的银河二号研制成功,运算速度提升到每秒10亿次,被国家气象局用来做中长期数值预报系统。
当年,银河二号还没出来之前,国家气象局一直想买美国的计算机来做预报系统,美国坐地起价,要加非常高,双方前前后后谈了将近10年,最终由于银河二号的诞生,让美国的这单生意黄了,依靠银河二号强大的算力,国家气象局以此来做中长期数值预报系统,可以进行5—7天的天气预报。
改革开放后,许多尖端科技对华解除了封锁。那时候流行的一句话是,“造不如买,买不如租”,我们的政策也变成了“以市场换技术”。既然国外的东西又便宜又好,我们为什么还要自己造呢?于是从80年代开始,技术人才大量流失,到学校教书,甚至成为了图书管理员。以至于到最后,奉行“贸工技”的联想,沦为了一家计算机组装厂。
好景不长,1989年,美国政府开始严格限制对中国的高性能计算机的出口,不仅价格奇高,同时还有一条附加条件:买来的超级计算机必须放在一个玻璃房子里,而钥匙在美国人手里,中国人不能只能看不能碰,每次使用的用途都要向美国人报告,请求批准。
为了拆掉美国人的“玻璃房”,国家派出一支年轻精干的科研小分队,远赴美国硅谷去搞曙光一号的研究。当时的科学计算所所长李国杰在黑板上写下了“人生能有几回搏”七个大字,斩钉截铁的对几个年轻人说:“派你们去,就相信你们一定能把机器给造出来!”在每天工作十五、六个小时,长达11个月的封闭式研究后,科研小分队成功设计出曙光一号核心部分。
(曙光研发现场)
四年后,1993年,中国“曙光一号”超级计算机研制成功,发布后仅仅第三天,西方取消了对中国出口超级计算机的限制,从此中国在超算的路上越走越远,并且捷报频传。
1995年,在只有500万经费的情况下,曙光1000诞生
1998年,曙光2000问世
2001年,曙光3000降生
2004年,曙光4000A诞生,算力首次破10万亿次
2008年,曙光5000降生,峰值运算速度达到230万亿次
2010年,曙光6000问世,屈居排行榜第二,第一是横空出世的天河一号,自此中国开始了霸榜之路
每次一次突围的路上,美国都要来横插一杠子,2015年,天河二号而天河1A问鼎冠亚军,美国坐不住了,由于这两台超算都使用了Intel的至强Xeon处理器和XeonPhi加速器,于是在2015年4月9日,美国商务部宣布对中国的四家超算机构禁运Intel的至强Xeon处理器和Xeon Phi加速器。
出乎美国人意料的是,2016年的超算冠军榜上还是来自中国的计算机,安装在国家超级计算无锡中心的“神威·太湖之光”登顶世界冠军。除了运行速度引人瞩目,全面采用国产众核芯片“申威”和操作系统,软硬件完全国产化,这更激扬了国人志气。
申威系列的CPU是由原总参谋部第五十六研究所(无锡江南计算技术研究所)设计,中芯国际代工,技术起源于美国的DEC公司Alpha21164处理器的技术,当时DEC公司是典型的技术强但商业上失败的公司,其在处理器设计领域的技术积累非常深厚。其Alpha处理器的技术资料在卖给我国的时候,已经包含了未来十几年处理器技术发展的蓝图。
五十六所(无锡江南计算技术研究所)以Alpha指令集为基础,扩展出自己的指令集,突破了异构众核处理器架构技术、异构众核处理器验证技术和基于28nm工艺的众核处理器物理实现技术。申威处理器自2006年诞生之后,已经发展出了多代不同的版本。在美国的禁令之后,搭载申威处理器的“神威·太湖之光”在2016年和2017年都位列榜首,再次让美国的计划落空。
不过,美国的禁令让天河二号处于休克状态,这棘手的问题亟需解决,面对来自美国的扼杀,天河二号在2017年底用国产的Matrix-2000协处理器替换了用了五年的Xeon Phi。根据为数不多的资料显示,Matrix-2000是由国防科大自主研发设计,但架构、来源一如既往地神秘。
这次升级把天河二号的每秒计算次数从3.39亿亿次提升到了6.14亿亿次,而功耗只增加了不到4%。所以六年了,天河二号还能在TOP500上排到第四,可以说相当出色。另一方面,天河二号取得突破的关键之一是中国自制的TH Express-2主干拓扑结构网络连接,这项技术世界领先。
禁运之后,英特尔的日子并不好过,其至强Xeon Phi加速器只有超算和大型机才会用到。并且中国的采购量占了一半左右,少了中国这个大客户之后,2016年6月18日,Xeon Phi 7290/7250加速器价格直接腰斩。到2017年8月24日,Intel 宣布Xeon Phi 7200系列协处理器加速卡进入停产退市进程。
全球超级计算机500强榜单始于1993年,每半年发布一次,是给全球已安装的超级计算机排座次的知名榜单。近几年天河与曙光系列超算稳居榜首,直到近期才被美国超越。
(中国超算TOP500逆袭之路)
最新榜单显示,美国橡树岭国家实验室的“顶点”系统以每秒14.86亿亿次的浮点运算速度位列榜首。排名第二的超级计算机是美国劳伦斯利弗莫尔国家实验室的“山脊”系统,中国超级计算机系统“神威·太湖之光”和“天河二号”分列榜单第三、第四位。
根据这份最新的榜单,美国共有117台超级计算机入围此次榜单,入围数量仅次于中国位居第二,但比较运算速度,美国超级计算机继续占据榜单的第一、第二位置。从总算力上看,美国超算占比为37.1%,中国超算占比为32.3%,中美在超算领域的差距较半年前进一步缩小。中美之后,日本、法国、德国、荷兰、爱尔兰、英国等也有两位数的超算系统入围本次500强榜单。
由于在奥巴马时期对出超算的不重视,美国在超算方面投入较少,特朗普上来之后,对超算又加大了投入,美国超算再一次反超,目前中国的新一代超算上马还得一段时间,暂时榜首还是美国的,在以后的一段时间里,超算处于两强争霸的状态。
从东方红一号的算盘计算数据,到改革开放后的第一个超算,第一次登榜,第一次登顶,第一次研发国产核心,第一次被禁,第二次被禁,第三次……,中国超算风风雨雨走过半个世纪,一步一步从无到有,从美国芯换成了中国芯,都是中国科研人员不甘落后所做出的的巨大努力,同时也是中国科技史的见证。