6月27日,云上科研智算平台CFFF(ComputingfortheFutureatFudan)在复旦大学正式上线。这台为发现和处理复杂科学难题而建的科研“超级计算机”由复旦大学与阿里云等共同打造,以先进的公共云模式供给超千卡并行智慧计算,拥护千亿参数的大模型训练——这在国内高校中尚属首例 。 (资料图像仅供参考) 延续复旦大学“博学而笃志 ,TMGM外汇平台交易环境切问而近思”的校训
,CFFF平台由面向多学科融合创新的AIforScience智慧计算集群“切问”一号和面向高精尖研究的专用高性能计算集群“近思”一号两部分组成
。 复旦大学浩清教授
、人工智慧创新与产业研究院院长漆远介绍,基于百G高速数据传输网和阿里云全球领先的大规模异构算力融合调度技术、分级存储技术、AI与大数据一体化技术,安排在复旦校内的“近思”一号和托管在阿里云乌兰察布数据中心的“切问”一号连成了一台真正意义上的“超级计算机”,复旦四校区的所有实验终端都能高速接入,做到异构算力统一运维,计算使命统一调度,TMGM外汇平台MT4下载满足不同软件场景下的科学智慧研究与软件需求 。 位于“东数西算”节点上的阿里云乌兰察布数据中心,通过飞天智算平台的公共云模式对外供给智慧计算服务
。 2022年,阿里云发布了飞天智算平台,并开展乌兰察布数据中心等两座超大规模智算中心 ,为科研 、公共服务和公司机构
,供给强大的智慧计算服务,可将计算资源利用率提高3倍以上
,AI训练效率提高11倍,推理效率提高6倍 。 据介绍,智算中心并不是简单把配置先进制程芯片的服务器连接起来就能实现高性能算力。一个很关键的指标就是损耗
。众汇代理智慧计算在这个方面,难度更大 。相比通用型计算,智慧计算需要海量数据进行训练,在数据迁移、分布式训练等环节损耗尤其严峻 ,旧有智算中心达到一定规模之后,提升算力资源反而会降低算力输出水平 ,千卡以上规模的算力输出最低往往仅有40%左右。但阿里云通过体系化的核心技术自研,以飞天智算平台作为输出
,大幅降低了智慧算力的损耗。 漆远表示
,有赖于公共云模式,跑在CFFF平台上的项目可享受到超千卡并行的智慧算力
,千卡并行的有效算力达到领域领先的92%,可拓展性达到万卡,万卡并行有效算力也可达90% 。 目前,CFFF平台上的第一个科研成果已经诞生 。复旦大学人工智慧创新与产业研究院李昊团队近期发布了45亿参数目的中短期天气预报大模型,预测效果在曝光数据集上第一次达到业界公认的ECMWF(欧洲中期天气预报中心)集合平均水平
,并将预测速度从原来的小时级缩短到了3秒内。 “基于CFFF平台的千卡并行智慧计算,这样一个规模的大模型只用一天就完成了训练。旧有的计算平台是很难做到的。”李昊说
。 这也是CFFF平台上孕育出的第一个大模型 。金力表示,复旦希望基于CFFF平台建成一批具有世界级作用力的科学大模型
,例如生命科学大模型 、众汇开户资料科学大模型
、大气科学大模型
、集成电路大模型等
。 据介绍
,将来,CFFF平台还将连续提升其算力规模
,并向复旦校外的科研机构、高校、医疗机构、高技术公司等开放。当天,面向全球科研人员的首届世界科学智慧大赛也公布正式开展
,大赛配置生命科学、量子化学等五大赛道,CFFF平台为参赛队伍供给免费训练算力
,并以更普惠的算力长期拥护部分科研项目
。(李思远) (素材出处:财政参考网) 标签: