侯建业

本文由是石科技CIO侯建业撰写并投递参与“数据猿年度金猿策划活动——2023大数据产业年度优秀CIO榜单及奖项”评选。

大数据产业创新服务媒体

——聚焦数据· 改变商业


是石科技(江苏)有限公司成立于2021年,由国家超级计算无锡中心与盐城超级计算中心共同成立,是国家超级计算无锡中心首个产业化运营公司。是石科技以算力网络为基础、核心技术研发为内核,面向国产超算产业化需求开展平台布局与建设,为盐城超级计算中心提供全面运维服务。

盐城超级计算中心于2022年7月正式揭牌成立,是国家超级计算无锡中心的首个分中心。2023年被科技部批示“国家新一代人工智能公共算力开放创新平台(筹)”。

是石科技基于国产算力基础设施,依托国家超级计算无锡中心运维管理经验,联合清华大学、北京大学、北京航空航天大学等高校技术优势,整合超算产业链资源,打造超算一体化建设、专业运维管理、多项应用服务的“1+1+N”模式。公司面向国家重大发展战略,以人才培养为驱动,以应用发展为目标,使超算系统从高校院所的科研工具成为生产工作的强力基石。聚焦城市重点产业,围绕气候气象、人工智能、生物医药、工业互联网等领域,全面推动产业高质量发展,成为国产超算产业化领军企业,为我国十四五新基建和新时代科技发展做出突出贡献。

算力基石,国之重器

算力,是数字时代的核心资源,它如同工业时代的电力,是驱动社会进步的引擎。而强大的算力,更是国家在数字时代的核心竞争力,“神威·太湖之光”更被誉为“国之重器”。

以大数据产业应用发展为基础,与云计算、人工智能、物联网、区块链等前沿技术融合,都离不开算力的支撑。在数字化日益加速的今天,算力已经成为衡量一个国家技术实力的重要指标。算力芯片作为算力产业的核心,自美国芯片禁令发布以来,曙光、浪潮、华为等国产算力品牌面临艰难的核心技术攻关问题,同时也对国内芯片产业快速发展带来了契机。

国家级超算中心以提升国家竞争力为首要目标,国内已建成了10多家国家级超算中心。其中,国家超级计算无锡中心运营的“神威·太湖之光”是我国首台采用国产处理器构建的世界第一的超级计算机,并连续4次蝉联国际TOP500榜单第一名。在当前中美贸易战、科技战日趋加剧的时代,神威作为完全基于中国设计并打造的新系统,算力芯片采用申威26010异构众核处理器,该众核处理器采用64位自主神威指令系统,峰值性能为12.5亿亿次每秒,持续性能为9.3亿亿次每秒,核心工作频率1.5GHZ,是我国突破芯片领域“卡脖子”技术的关键成果。2021年,最新一代的神威超级计算机成为我国首台突破百亿亿次计算能力的超算,并在计算性能、能耗比等重要参数上再次实现世界第一。


超算系统结构图

目前,国家超级计算无锡中心运行模式较为成功,相比其他超算中心由研制单位派出团队联合地方政府运行的模式,国家超算无锡中心的模式主要依托科研单位(清华大学、国家实验室 ),并作为科研单位的应用和支撑平台,努力建设国产软硬件一体化生态。在建成后的5年内,科研及产业化方面硕果累累。在科研领域国家超级计算无锡中心连续两年获得了国际超算届的最高奖项”戈登·贝尔”奖,实现了中国在该领域“零”的突破;在产业化方面,其支持了20多个行业的计算模拟需求,并与多个国家级实验室建立长期业务合作。

超/智算中心赋能大数据应用

超算主要用于科学计算,在工业、工程、制造方面,主要用于航空航天、能源、结构设计等领域。随着大数据和人工智能应用的兴起,计算技术在基于数据的智能制造、个性化服务、医疗、政务、物流、交通等多种领域都显示了潜力巨大应用前景。超算也随之从科学研究和工程计算向更广泛的大数据、人工智能、社会治理和生产生活领域渗透。科学计算对于信息产业的作用,可以类比军工中的航空航天对民用制造的作用,发展科学计算带来的新技术、新方法、新需求对工业、消费领域信息技术在更集成、更高速、更高效方面起了关键性的推动作用。

在面向大数据的操作系统上,大数据的处理正在从粗放走向集约,性能、成本、功耗等多方面的约束为面向数据的系统结构设计提供了新的维度。一方面,异构众核CPU、新型存储器件、开源硬件等的出现为面向大数据的系统结构提供了新的机会;另一方面,新型应用对时延、吞吐等方面要求的不断提升对大数据的系统结构提出了新的挑战。

大数据与人工智能深度融合的时代已经来临,盐城国家级人工智能公共算力平台的建成,将为大数据处理、人工智能基础大模型研究与上层服务提供基础算力、存储和数据能力保证,确保在传统大数据应用领域以及气象气候、生物医药、能源材料等诸多传统高性能计算与人工智能相融合的新领域,能够基于已有成果积累快速开展应用服务研发部署工作,借助大规模异构算力和存储能力,在深度神经网络规模、数据集规模等方面有较大提升。

超算应用成果转化

1、“神威·太湖之光”人工智能平台

我们联合国家超算无锡中心和清华大学的科研团队共同开发了基于“神威·太湖之光”超级计算机的人工智能平台,并部署于盐城超级计算中心,其中包括人工智能专用算法库的开发、分布式机器学习、深度学习框架,大数据平台以及应用开发和部署平台等多个关键的软件模块,构成了一套完整的人工智能解决方案。

2、神威深度学习算法库 SWDNN

为支持现有深度学习算法和应用在“神威·太湖之光”上的部署基于申威异构众核处理器(SW26010),我们开发了针对卷积、矩阵乘等深度学习核心计算模块的算法库 SWDNN。利用采用计算任务划分、计算通信重叠、寄存器通信等优化技术,计算模块达到了 60% 的计算效率相比于 GPU(K40m)上的 CuDNN 算法库,可以取得 1.91-9.75 倍的双精度浮点数性能优势。

3、遥感图像分类

基于“神威·太湖之光”平台,对海量未标注遥感图像数据进行非监督分类处理,采用数据:地表覆盖遥感图像 (>10TB)算法使用了:K-means clustering、自动编码器(SAE)、卷积神经网络(CNN)。

4、大规模机器翻译

国家超级计算无锡中心联合盐城超级计算中心共同完成核高基百卡测试训练,并完成针对千万级翻译句对数据集,基于“神威·太湖之光”超级计算机,训练多层 LSTM、端到端翻译模型、基于注意力的模型,单个任务最大训练规模可达 1024 节点。

5、算力中心隐私安全平台

我们联合国家超算无锡中心和北京熠智科技有限公司共同开发了应用于算力中心的隐私计算保护平台,并部署于盐城超级计算中心。该平台面向大规模算力基础设施,用以解决分布式计算中数据、模型安全问题,促进数据、模型、算法等合规有序融合共享,维护数据提供方权益。

综上所述,算力被誉为第四次工业革命基础,大数据资源的累积是产业发展站在“巨人肩膀”上的必要条件,在人工智能应用兴起的背景下,算力与大数据相互结合,将为数字经济产业化带来巨大机遇。我们将推进超算/智算将以全新的业态产品服务于传统产业工作,助力产业经济数字化建设。

·关于侯建业

侯建业,是石科技副总经理兼CIO,国家超算无锡中心盐城分中心副主任、国家级新一代人工智能开放平台负责人、多年互联网从业经验。主要从事大规模集群运维,国家级超算、智算平台运营,大语言模型应用和国产化适配,气候气象、航空航天等领域的模拟研发

·关于推荐企业:熠智科技

北京熠智科技有限公司是国内领先的隐私保护解决方案提供商,公司基于DataVault可控计算、Fidelius机密计算、区块链和联邦学习等技术,面向智算、金融、能源、政务和工业等领域的数据要素流通场景,提供数据、模型算法的全流程高性能隐私保护方案。其中公司自主研发产品DataVault可控计算面向大规模算力基础设施,首次开创性的应用于国内高性能计算场景,解决了分布式计算中数据、模型安全问题。结合此前熠智科技联合多家行业伙伴发布的DataVault大模型推训一体机,熠智科技具备从单机到集群大模型隐私安全保护方案的部署能力。公司拥有隐私计算、区块链相关发明专利和软件著作权百余项。