本刊记者韩熔桓
2010年11月01日
排列在国防科技大学的“天河一号”巨型计算机
在位于天津滨海新区的国家超级计算天津中心,我国首台千万亿次超级计算机系统“天河一号”的13排计算机柜已全部安装到位。近日,本刊记者就“天河一号”性能特点与战略意义等问题采访了国家超级计算天津中心主任刘光明。
刘光明说,今年初,作为“天河一号”的首批设备,一个峰值性能达到百万亿次的计算机系统已在国家超级计算天津中心投入运行。千万亿次计算机系统建成后,将把计算任务过渡到千万亿次系统。目前,国家超级计算天津中心在京津地区的用户数正逐步增加。
“天河一号”安装了由国防科技大学自主研制的“天河”高性能CPU芯片,全系统的整体计算处理能力大幅提升,在信息安全方面有更强的技术保障。
国家超级计算天津中心还将面向石油勘探、金融风险分析、云计算、三网合一视频数据存储等重要领域开展计算服务。
中国计算的珠穆朗玛
2009年10月29日,国防科技大学成功研制出的峰值性能为每秒1206万亿次的“天河一号”超级计算机在长沙亮相。刘光明说,我国成为继美国之后世界上第二个能够研制千万亿次超级计算机的国家。超级计算机又称高性能计算机、巨型计算机,是世界公认的高新技术制高点。以“天河一号”承担的“中新生态城动漫渲染平台”项目为例,普通电脑需一个月完成的运算任务,“天河一号”只需一天。
刘光明说,在超级计算机不断提高运算速度的过程中,千万亿次是一个难以逾越的“瓶颈”。美国早在上个世纪90年代就提出了做千万亿次巨型计算机的目标,直到2007年才实现。截至2009年6月,世界上仅有3台千万亿次的计算机。
千万亿次计算机的出现,为中国高科技计划的实施提供了一个更为广阔的平台。刘光明说,某些领域的现实需求,已经超出了目前巨型机的能力。气候预报、环境控制、飞行器设计、系统生物学等领域都需要千万亿次甚至更高性能的计算机。因此,“天河一号”投入使用后,必将提升科学研究的速度。
刘光明说,“天河一号”采用7项关键技术,使得一加一的结果尽量接近二,从而发挥出机器最大的整体效能。这7项技术包括:多阵列可配置协同并行体系结构、高速率扩展互联通信技术、高效异构协同计算技术、基于隔离的安全控制技术、虚拟化的网络计算支撑技术、多层次的大规模系统容错技术和系统能耗综合控制技术。
刘光明说,由于采用了一系列创新技术,这台计算机具有四大特点:
一是高性能。无论是1206万亿次的峰值性能,还是563.1万亿次的Linpack实测性能,均位于国内榜首、世界一流。它1天的运算量,1台桌面电脑要连续工作160年才能完成。刘光明说,它的存储能力也可谓“海量”:内存总容量98TB,共享磁盘容量为1PB。如果给13亿中国人每人拍一张高清晰数码照片,“天河一号”完全可以装下。同样惊人的是它的通信速度,“天河一号”点点通信带宽为每秒40Gb,相当于1秒钟内下载5部高清电影。
二是低能耗。能耗是每瓦电创造的计算效能,“天河一号”目前能效为每瓦4.3亿次运算,与2009年6月公布的Top 500(全球超级计算机前500强)排名第一的美国“走鹃”(Roadrunner)相当。
三是高安全。“天河”实现了不同用户间数据和工作信息的相互隔离。对用户来说,相当于到银行租个保险柜,钥匙掌握自己手里。
四是易使用。“傻瓜化”的操作界面和菜单、鼠标等常规操作,让机器的使用变得简单。同时,作为一台国际通用的标准化的超级计算机,“天河”上能运行来自各行业的各种程序,不存在兼容性问题。
推动科技创新的战略高技术
刘光明说,当今世界,高性能计算已成为理论和试验之外的第三种科学研究手段,是推动科技创新和经济社会发展的战略高技术。各大国纷纷投入巨资研制开发超级计算机系统,以提升综合国力和科技竞争力。
“天河一号”从飞机设计、医药研发到台风预报、能源勘测,都有用武之地。用“数字风洞”辅助设计飞机气动外形,可以快速、准确地测定风阻系数和结构强度,从而确定所用的材料。原来设计一个飞机气动外形要花三五年,有了“天河一号”的帮助,几个月就可以完成。
用“天河一号”数值模拟蛋白质、分子结构,可以快速研发生物医药,可以把研制时间由原来的十几年缩短到几年,将为人类攻克艾滋病、癌症等顽疾提供更多机会。
借助“天河一号”,可以快速构建数字地质模型,探明地层中是否有石油,并能精确计算出储量,判断是否有开采价值。
此外,“天河一号”还可用于卫星遥感数据处理、金融工程数据分析、气象预报、海洋环境数值模拟、短临地震预报、新材料开发设计、土木工程设计,以及基础科学理论计算等。
无论是台风预报,还是能源勘探,都因规模超大、程序复杂而被称为“重大挑战性问题”,需要对海量数据进行快速准确的计算、分析,离开了超级计算机无法想象。
刘光明说,以“天河一号”为业务主机,国防科大和天津将在滨海新区共建国家超级计算天津中心,预计2011年底完成科技部组织的验收,然后对国内外开放,正式投入使用。
巨型计算 只争朝夕
“天河一号”研发团队有200多人,核心骨干的年龄平均36岁,其中大部分是博士。刘光明说,研制“天河一号”的国防科大计算机学院,是被中央军委授予“科技攻关先锋”荣誉称号的优秀团队,1983年研制出第一台亿次巨型计算机—“银河—Ⅰ”,实现了我国巨型机“零”的突破;之后又相继研制出不同量级的“银河”系列巨型机,把我国超级计算机研制水平一步步推向世界前沿。
当中国高性能计算机TOP100组织收到国防科大提交的“天河一号”性能测评报告时,很是吃惊:根据他们的预测,我国千万亿次超级计算机最快也得到2010年底才能研制出来—没想到国防科大提前一年就做出来了,而且干得相当漂亮。
“我们能提前做出来,靠的是研发团队争分夺秒、只争朝夕的超常付出。”刘光明说。强烈的忧患意识和为国争光的责任感,时刻激励着“银河人”。四年来,研发人员没有歇过完整的周末和节假日,每天都是三班倒,机房一年365天灯火通明。去年国庆8天长假,大家只休息了一天,为的是观看国庆阅兵式,为自己鼓劲。
国际计算机界认为,从百万亿次提升到千万亿次是一个质的变化,不可能通过单纯扩大规模来实现,而是需要体系结构上的改变。“天河一号”采用了全新的多阵列可配置协同并行的体系结构,从而实现了系统性能的提升。这种体系结构具备构建下一个量级即万万亿次计算机的能力,将会成为下一代高新计算机的主流结构。
链接:
中国超级计算机发展大事记
1983年,历经5年研制,中国第一台被命名为“银河”的亿次巨型电子计算机在国防科技大学诞生。
1992年,国防科技大学研制出银河—II通用并行巨型机,主要用于中期天气预报。
1993年,国家智能计算机研究开发中心(后成立北京市曙光计算机公司)研制成功曙光一号全对称共享存储多处理机。
1995年,曙光公司又推出了曙光1000,峰值速度每秒25亿次浮点运算,实际运算速度上了每秒10亿次浮点运算这一高性能台阶。
1997年,国防科技大学研制成功银河—III百亿次并行巨型计算机系统,峰值性能为每秒130亿次浮点运算。
1997至1999年,曙光公司先后在市场上推出曙光1000A、曙光2000—I、曙光2000—II超级服务器,峰值计算速度突破每秒1000亿次浮点运算。
1999年,国家并行计算机工程技术研究中心研制的神威I计算机,峰值运算速度达每秒3840亿次。
2004年,由中科院计算所、曙光公司、上海超级计算中心三方共同研发制造的曙光4000A实现了每秒10万亿次运算速度。
2008年,“深腾7000”是国内第一个实际性能突破每秒百万亿次的异构机群系统,Linpack性能突破每秒106.5万亿次。
2008年,曙光5000A实现峰值速度230万亿次、Linpack值180万亿次。
2009年10月29日,中国首台千万亿次超级计算机“天河一号”诞生。