期刊-2024-08

郑纬民: 智力成就算力,传道感动中国

文/本刊记者 邱惠颖 于宝源

2024年08月12日

屏幕截图 2024-10-12 164929.png


算力,作为衡量一个国家数据处理能力的关键指标,指的是数据中心处理数据并输出结果的计算能力。据了解,我国现有算力总规模位居全球第二,在此成就的背后,不得不提及一位杰出的贡献者,他就是中国工程院院士、清华大学计算机科学与技术系教授郑纬民。

郑纬民作为计算机系统结构领域的权威专家,倾尽一生,在计算机领域取得了卓越的研究成果,多次荣获国家科技进步奖,为我国超算领域的发展作出了杰出贡献。

 

自强不息,不坠青云之志

1946年郑纬民在浙江宁波鄞州出生。1959年,步入初中求学阶段的郑纬民上学路程需要从位于东钱湖陶公山曹家山头的家中,穿越1小时的石子路,前往所就读的中学——钱湖中学(现今东钱湖旅游学校)。这段充满“坎坷”的路程,他几乎每日都赤脚小跑,风雨无阻,但从未迟到。正因“少年当有凌云志,万里长空竞风流”,这段不易的经历,为他的人生带来了深远的影响,铸就了他坚韧不拔、吃苦耐劳的品格。郑纬民说:“大学教我知识,中学教我做人,培养了我吃苦耐劳、集体主义的精神。”

1965年,郑纬民考入清华大学自动控制系。当时,计算机还只是自动控制系的一个专业,算法、存储、系统等基础理论的研究,在国内还比较落后,没有人能准确判断中国的计算机事业将有怎样的未来。

1970年毕业后,郑纬民留校执教,并留任至今。如今,他担任清华大学教授及博士生导师,同时兼任多家国家重点实验室学术委员会委员。他专注于网络存储、网格计算等方面的科研教学,成绩卓著,荣获国家科技进步奖一等奖1次,国家科技进步奖二等奖2次,以及国家技术发明奖二等奖1次。

郑纬民作为计算机领域的权威专家,不仅在科研领域取得了斐然成就,独特的教学风格也赢得了广大学子的深度认可与敬爱,他培养了数百位博士和硕士,这些学生在中国计算机领域的研究中发挥着重要作用。

此外,郑纬民还曾荣获感动中国2022年度人物“银发知播”称号,他充分利用视频与直播等平台,打破传统教室的界限,构建了一所没有门槛的大学学堂。他秉承着“师者,所以传道受业解惑也”理念,将毕生所学和人生经历倾囊相授给青年们,他孜孜不倦地通过网络拉近与青年的距离,传播科学知识、解读技术热点。

郑纬民在B站上拥有17.7万粉丝,他开设的网络课堂内容丰富多彩,小到精准预报冬奥会各个场馆的天气,大到模拟核试验等宏大议题。同时,他还对当前热门的元宇宙、区块链、芯片等技术进行全面地解读。郑纬民以风趣幽默的方式,将晦涩难懂的技术语言简化成通俗易懂的知识,赢得了大量年轻网友的喜爱。

郑纬民在知识传播的道路上从未止步。他的热情源于对知识的不懈追求、对他“师者”身份的责任担当以及对理想的敬畏。他慷慨地分享自己的知识和经验,毫不吝啬地将自己的所思所得,倾囊相授,让更多的人从中受益。与此同时,他始终关注着年轻一代,希望他们能够在知识的海洋中茁壮成长。

 

是师者,敬业者,亦为士者

作为计算机系统结构的学科带头人,为师者,他传学,受业,解惑;为敬业者,他专心致志,以事其业也;为士者,他肩担国家重任,创行业领域之新。如今,年近八旬的郑纬民院士,仍然在存储领域进行技术难题攻关。他认为:“研制具有自主知识产权的国产存储系统,是国家信息安全的战略需要,科研人员得不怕吃苦,勇争第一。”这是他的个人理念,也是他近几十年科研生涯的真实写照。

据郑纬民的学生回忆,他与学生们每日投入的工作时长常达十多个小时,他一直鼓励学生们要以沉稳的心态深入研究,并且认为,做计算机系统结构方面的研究,要做好吃苦的准备,脚踏实地把实际工作推进,才能成就一番事业。

此外,郑纬民在科研工作中,对团队中的每位成员的要求就是“做事,就要做有用的事,做对国民经济有用的事。”郑纬民认为,做出来的产品也要切实服务于现实需求。“现在很多人觉得多发论文最重要,不是说这些没有价值,而是真正做研究,要能让理论落地,不能在纸上空比画。做事,还是得务实一些。”郑纬民说。

在科研创新领域上,郑纬民成就显著。他与团队创新性地提出软件定义的IO控制器设计方法,解决了可扩展问题。与此同时,又成功开发自维护大容量存储系统,在攻克这三大难题上又前进了一大步,将集群计算机、CPU设计、网格计算、高性能存储等确定为高性能计算技术研究所的研究方向。

此外,在他的带领下,用一年的时间研制成功了中国当时运行频率最高的高性能嵌入式CPU-THUMP107,其最高频率为500兆赫,功耗<0.5瓦。此外,由他牵头完成的生物信息学网格已经投入实际运行,每天的用户访问量超过了5万人次,并且所研制的网格中间件、网格监控系统和网格互联互通技术已应用于国家科技大平台、上海科技大平台和某国防单位。

“数据是战略资源。存储系统承载数据,是网络空间安全的核心基础设施,但是目前面临三大技术挑战:可扩展性、可靠性和集约性。”郑纬民说。

截至2009年7月,由郑纬民领导的网格计算研究组取得了多项具有自主知识产权的成果,已推广到20多家重点大学使用。

在网络存储方面,郑纬民主导研发的“高可扩展海量存储网络系统TH-MSNS”,已通过中国软件评测中心评测和教育部的鉴定,其中带外虚拟存储技术、大容量内存虚拟磁盘技术进入国际领先行列。TH-MSNS系统是中国国内具有自主知识产权的国产网络存储系统,分别获2004年北京市科学技术二等奖、2005年首届“中国计算机学会创新奖”二等奖等,2005年国家863计划首届“浪潮高性能计算创新集体奖”二等奖。

后来,郑纬民在TH-MSNS系统的基础上,创造性地提出了另一思路——社区共享。如果能够实现社区共享,则不需要重复存储,这就是现在流行的云盘技术的基本原理。21世纪初期,该技术原理仍处于探索阶段,郑纬民便通过网格技术将各高校的资源进行有效整合,实现了存储一份、全网下载的目标。基于社区概念的网络数据共享和存储技术,他主持研制了国内首个云计算平台Tsinghua Cloud,并为社会公众提供了优质服务。使命在肩勇奋楫,重任千钧为担当。“每一个创新成果的取得,都非常不容易,需要付出常人难以想象的努力。”在谈及创新成果的取得时,郑纬民表示,“有可能是8年,也有可能是10年。研制四大存储系统,我们花了近30年。”

郑纬民所率领的团队,不仅成功突破了计算机存储系统领域中的一系列关键技术瓶颈,还凭借其在自主研发产品上所展现的卓越性能,获得了国际同行的广泛认可。

然而,步履不停,创新不止。2016年11月,在美国举行的全世界高性能计算大会上,郑纬民和他的团队斩获戈登·贝尔奖,实现中国科学家在此奖项上零的突破。第二年,郑纬民团队再次杀入大赛,在我国超级计算机“太湖之光”上,成功“回放”唐山大地震全过程,第二次摘得此奖。

 

屏幕截图 2024-10-12 165109.png


以启新章,担重任,再奋进

郑纬民作为我国超算领域专家,不仅带领着清华大学研究团队斩获多项殊荣,还在新兴科技领域取得了令人瞩目的成绩,为我国超算事业的发展作出了杰出的贡献。

在当前人工智能应用日益普及,成为各行业智能化转型发展的显著趋势下,郑纬民已与团队在人工智能领域深耕多年,所获成果斐然。他们的研究主要集中在AI与算力基础设施的设计、评测与优化上。在此领域,他们提出了AI算力基础设施的架构和平衡设计原则,并推出大规模人工智能算力基准测试程序AIPerf,该程序于2020年11月15日正式发布,为业界提供了一个客观评估AI算力性能的标准。

不仅如此,郑纬民及团队还提出百万亿参数超大规模训练模型的加速方法,将数据并行、模型并行、专家并行三种训练模型开源到FastMOE系统当中,得到业界的认可与应用,有效推动了AI技术的发展。

郑纬民表示,人工智能发展有三驾马车,其中一驾就是算力,算力不足就没办法做好人工智能。目前,我国算力基础设施规模位居全球第二,截至2023年底,我国在用数据中心机架总规模超过810万架,算力总规模达到230EFlops。存力规模不断扩大,先进存力建设稳步提速,截至2023年6月底,我国存储总量达到1080EB,存力规模增长速度达到23%,其中以闪存技术为代表的先进存力占比不断提高,部分行业超过25%。随着我国算力基础设施规模高速增长,存力规模不断扩大,网络设施不断完善,到2025年算力规模将超过300EFlops,存储总量超过1080EB,先进存储容量占比达到30%。

算力的重要性无可争议。郑纬民认为,人工智能未来更重要的是基于大模型研发行业细分领域的垂直模型,加强AI算力芯片设计、软硬件生态建设与产业化应用。通过完善开放的产业生态,推动各行各业数字化转型,从而真正促进数字经济和大模型产业的健康发展。

然而,我国当前的人工智能发展所面临的困难重重。国产AI芯片的系统有着国产卡应用不足、生态系统有待改善等问题。对此,郑纬民表示,改善基于国产AI芯片的大模型训练生态系统是关键,途径则是要尽快做好10个软件,即编程框架、并行加速、通信库、算子库、AI 编译器、编程语言、调度器、内存分配、容错系统、存储系统。并且郑纬民还指出,作为一种替代方案,做好软硬件协同设计,超级计算机和目前众多的计算中心也可以进行大模型训练。

由于当下人工智能、区块链、元宇宙等尖端技术的迅速崛起,高性能计算、并行处理、存储系统等核心基础技术的地位呈现越来越重要。与此同时,国际的技术竞争日趋激烈,欧美国家的技术制裁及封锁在一定程度上限制了AI技术发展进步,因此打破技术壁垒、实现技术自主的任务显得尤为艰巨。“我们肩负的责任与使命依然重要。”郑纬民说。

回看郑纬民的科研人生,每一阶段都充满了挑战与坚持,他以坚韧不拔的毅力,不断攀登科学的高峰,在存储系统领域,将我国实现了“从0到1”再到“世界领先”的奇迹跨越,现在又全身心地投入人工智能的研究。这样的精神激励着无数的科研工作者对科学事业的全情投入和对推动国家向前发展的满腔热情。

此外,无论在科研领域的卓越贡献,还是在教育事业的崇高地位,郑纬民始终都保持着低调谦逊的品格,不将个人的光辉放大。他一生都在贯彻着“做有用的事,做对国民经济有用的事”的要求,将个人的努力和付出默默奉献给国家的科技进步,这正是他科学精神的体现和崇高追求。

屏幕截图 2024-10-12 165121.png