我国AI领域的国家队力量

在当今时代,人工智能(AI)已成为全球科技创新的前沿阵地,它不仅深刻影响着经济结构的转型升级,更在重塑着人类社会的方方面面。AI的发展水平和应用范围,已成为衡量一个国家科技创新能力和国际竞争力的重要标准。它关乎未来,关乎每一个行业的发展,关乎每一个人的生活。
近年来,我国高度重视AI技术的发展,将其上升为国家战略,通过一系列政策支持和资金投入,推动AI技术的研究和应用。
根据相关披露,在一共26个国家实验室中,可以明确有AI领域成果的实验室有3家,分别是上海浦江实验室、深圳鹏城实验室、杭州之江实验室。另外北京智源人工智能研究院,也是目前我国AI研究领域非常重要的一股力量。

1. 上海浦江实验室(上海人工智能实验室)

 
图片

整体介绍

上海浦江实验室,也称为上海浦江人工智能创新中心或上海人工智能实验室,是我国人工智能领域的新型科研机构,开展战略性、原创性、前瞻性的科学研究与技术攻关,突破人工智能的重要基础理论和关键核心技术,打造“突破型、引领型、平台型”一体化的大型综合性研究基地,支撑我国人工智能产业实现跨越式发展,目标建成国际一流的人工智能实验室,成为享誉全球的人工智能原创理论和技术的策源地。
团队主要成员包括原实验室主任汤晓鸥博士(已故),领军科学家、科学智能部门主任欧阳万里等,领军科学家乔宇,林达华教授等。

研究方向

浦江实验室的研究主要涉及人工智能研究的六个方向:
  1. 人工智能基础理论:开展人工智能前沿基础理论研究,包括机器学习、强化学习、深度学习、知识计算、因果推理、信息安全等关注人工智能交叉学科研究,探索数据驱动的科学研究新范式。
  2. 人工智能开放平台:构建人工智能新型大数据、算法和算力等平台,全面支撑人工智能基础和应用研究。
  3. 人工智能应用:探索人工智能技术在城市、交通、医疗、教育、文旅、金融、制造业等行业的应用,关注新领域,开展共性技术平台的研发。
  4. 人工智能核心技术:发展新一代人工智能技术,包括计算机视觉、自然语言处理、语音处理、决策智能、智能机器人、城市计算、计算机图形学、数字孪生等。
  5. 人工智能基础软件和基础硬件系统:开展人工智能基础软硬件系统的研发,构建技术生态的软硬件基础,包括新一代人工智能训练框架、编程语言、编译器等基础软件,人工智能芯片、传感器等基础硬件。
  6. 人工智能伦理与政策:关注人工智能可能引发的经济、社会、伦理、法律、安全、隐私和数据治理等问题,提出解决方案,提供政策参考。

主要成就

 

1、“OpenXLab浦源”人工智能开源开放体系

2022世界人工智能大会(WAIC)科学前沿全体会议上,上海人工智能实验室(下称“实验室”)发布了“OpenXLab浦源”人工智能开源开放体系,该体系九大开源项目,覆盖从感知到决策,从平面到立体,从数据到计算,从技术到人文教育的各个方面。
“OpenXLab浦源”人工智能开源开放体系包含OpenMMLab 2.0浦视视觉算法开源体系,OpenGVLab书生通用视觉开放体系,OpenDILab 1.0浦策决策智能开源平台,以及首次亮相的OpenXDLab浦画高质量数字内容平台、OpenDataLab浦数人工智能开放数据平台、 OpenComputeLab浦算人工智能开放计算体系等6个平台。
OpenMMLab在GitHub平台星标数(Star)突破11万,已经成长为全球最具影响力的计算机视觉开源算法体系之一。目前,OpenMMLab累计开源了超30个算法库,拥有超400种算法实现和超3000个预训练模型。代码仓库总下载量超1700万次,用户遍及140多个国家和地区,涵盖全球多所顶尖高校、研究机构和企业。

2、“书生”大模型

(1)书生浦语2.0:大语言模型
大语言模型书生·浦语2.0(InternLM2)回归语言建模本质,通过提高语料质量及信息密度,实现了模型基座语言建模能力获得质的提升。支持20万字牌(token)超长上下文,性能领先同量级开源模型,以20B的规格超越GPT-3.5。InternLM2现已开源并提供免费商用。
(2)书生·视觉大模型:视觉任务性能开源领先,创新视觉大模型架构
书生·视觉大模型(InternVL)首次提出了对比-生成融合的渐进式对齐技术,实现了在互联网级别数据上视觉大模型与语言大模型的精细对齐。以不到1/3的参数量超越视觉模型标杆谷歌ViT-22B,在MMBench等评测上比肩GPT-4V和GeminiPro。InternVL全系列模型、代码均已开源。
(3)书生·浦语灵笔2.0:个性化高质量的图文混合创作大模型
图文混合创作大模型书生·浦语灵笔2.0(InternLM-XComposer2)能力全面升级,支持个性化高质量图文创作,图文理解和创作能力领先开源社区。得益于实验室原创的全新多模态模型架构Partial-LoRA,书生·浦语灵笔2.0可同时兼顾图文创作和多模态理解。模型及代码均已开源,提供免费商用。
(4)书生·浦语数学:中轻量级参数刷新开源模型数学能力上限
数学模型书生·浦语数学(InternLM2-Math)以中轻量级参数规模,在多项数学评测中刷新开源模型数学能力上限。该模型为首个同时支持形式化数学语言及解题过程评价的开源模型,以强大内生计算和推理能力,为技术社区提供强大数学工具和模型范式。代码和模型完全开源,并支持免费商用。
(5)Hulk:新一代以人体感知为中心(Human-Centric)的多模态大模型
Hulk是新一代以人体感知为中心(Human-Centric)的多模态大模型,该项技术将支撑实现全面感知任务,助力元宇宙、运动分析等领域的发展,推动人体感知迈向通用模型时代。
基于原创的统一建模和模态转换方案,Hulk实现多个突破:首次实现无需微调的一个大模型同时支持2D/3D、骨架、视觉语言等多模态任务;首次实现不同模态间的任意转换;首次以单一模型在8大类以人为中心的感知任务超越各类最佳专有模型(Specialists)的能力。

大模型评测体系

(1)因果推理评测体系CaLM
大模型因果推理开放评测体系及开放平台CaLM(Causal Evaluation of Language Models,以下简称“CaLM”)。首次从因果推理角度提出评估框架,为AI研究者打造可靠评测工具,从而为推进大模型认知能力向人类水平看齐提供指标参考。
因果推理是人类认知能力最重要的特征之一,提升因果推理能力被视为由机器智能迈向人类智能水平的关键步骤。为对大模型进行科学有效的因果推理能力评估,上海AI实验室联合团队在CaLM中提出包含因果评估目标(Causal Target)、评估方式(Adaptation)、评估标准(Metric)及错误分析(Error)的评估框架,同时构建了超过12万道题目的中英文数据集。
(2)OpenCompass2.0:一站式评测,助力大模型技术创新
大模型开源开放评测体系司南(OpenCompass2.0)旨在为大语言模型、多模态模型等提供一站式评测服务,客观中立地为大模型技术创新提供坚实的技术支撑。目前包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass2.0助力开展技术研发。

AI智能体

多模态交互智能体框架OpenPAL在多人实时竞技环境中,首次验证了AI智能体在开放任务中的人机交互能力,在面对未知环境时可以实现“自我进化”。相较于此前智能体框架,其部署成本更低,将为人类提供更友好、更可靠的“AI队友”支持,助推“人机共智”。

2. 鹏城实验室

 
图片

整体介绍

鹏城实验室是中央批准成立的突破型、引领型、平台型一体化的网络通信领域新型科研机构。作为国家战略科技力量的重要组成部分,实验室聚焦宽带通信、新型网络、网络智能等国家重大战略任务以及粤港澳大湾区、中国特色社会主义先行示范区建设的长远目标与重大需求,按照“四个面向”的要求,开展领域内战略性、前瞻性、基础性重大科学问题和关键核心技术研究。
鹏城实验室有7个研究部,分别为宽带通信研究部、新型网络研究部、网络智能研究部、电路与系统研究部、媒体与交互研究部、战略与交叉前沿研究部和智能计算研究部。鹏城实验室主要研究方向是网络通信、网络空间和网络智能,目前人工智能方向主要由网络智能研究部负责。
网络智能研究部
网络智能研究部由高文院士领衔,拥有全球领先的智能算力大科学装置“鹏城云脑”,贯通云态智能计算软件体系,研制体系化网络智能集群开源软件栈,突破感知、评价、决策一体化的多维度协同与持续进化的云网协同智能等共性关键技术,支撑智能制造、物联网、工业云、人工智能等规模化产业应用。
研究部设有云脑研究所、高效能云计算研究所、视觉智能研究所、云脑使能研究所、具身智能所。研究部人员构成多元化,现有全职、博士后、双聘、访问学者、联培博士生等500多人,团队成员均来自海内外知名高校。
鹏城云脑II
“鹏城云脑Ⅱ” 超级计算机项目是鹏城国家实验室的核心项目。“鹏城云脑”网络智能重大科技基础设施是面向国家重大战略、满足基础研究需要、推动数字经济发展的关键大科学装置。“鹏城云脑Ⅱ”基于自主可控的国产AI芯片,采用高效能计算体系结构,可提供不低于1000P OPS的整机AI计算能力和64PB的高速并行可扩展存储,AI算力处于国际先进水平。截至目前,“鹏城云脑II” 连续七次蝉联全球超级计算大会(SC23)的国际IO500排行榜。
“鹏城云脑Ⅱ”建立了支持千亿参数超大规模AI模型的并行训练平台,支持了“鹏程·盘古”“鹏程·神农”“鹏程·大圣”“鹏城-百度·文心”“悟道2.0”等一系列AI大模型训练,支撑了疫情防控、智能交通等场景的实际应用,形成了具有影响力的AI大模型应用技术体系,推动了产业升级和技术体系并行发展。
另外,“鹏城云脑Ⅲ”已列入规划。

主要成员

 
鹏城实验室主要成员包括主任高文院士,副主任石光明,还有近30个院士领衔的基础研究工作室、28位领军人才、193位科研项目骨干人才。通过单聘、双聘等创新模式,近两千名科研人才集聚于此,其中获得杰青、长江、IEEE 和ACM Fellow等称号的高端人才就有240位。

主要成就

鹏城实验室为国产算力国产的大模型或者从零状态开始训练大模型提供非常好的训练算力。这些模型包括鹏城自己主导的开源模型,包括鹏城·盘古、鹏城·丝路、鹏城·大圣、鹏城·扁鹊、鹏城·通言、鹏城·通图、鹏城·常羲、鹏城·脑海等等。

1、鹏程·盘古

鹏城实验室联合有关单位技术团队基于“鹏城云脑Ⅱ”和MindSpore框架的自动混合并行模式实现在2048卡算力集群上的大规模分布式训练,训练出业界首个2000亿超大参数中文预训练模型“鹏程·盘古”。盘古训练代码、模型、部分数据、在线功能体验、模型压缩及跨平台微调推理已同步在OpenI启智社区全部开源开放。
鹏程·盘古α目前在OpenI启智社区开源了两个版本:鹏程·盘古α和鹏程·盘古α增强版,并支持NPU和GPU两个版本,支持丰富的场景应用,在知识问答、知识检索、知识推理、阅读理解等文本生成领域表现突出,具备较强的少样本学习的能力。

2、鹏程·神农

鹏程·神农是鹏城实验室发布面向生物医学领域的AI大模型,以人工智能赋能加速新型药物筛选与创制。
鹏程·神农包含蛋白质结构预测、小分子生成、靶点与小分子相互作用预测、新抗菌多肽设计与效果评价等模块。制药企业和医学研究机构可以使用鹏程.神农提供的AI能力,加速新型药物的筛选与创制。
以抗菌肽为例,借助鹏程.神农强大的氨基酸序列生成能力,结合现有抗菌肽数据集,可在短时间内产生数万种候选肽的氨基酸序列,再经过生物实验和临床验证,便可极大加速新型抗菌肽的发现。

3、鹏程·丝路

“鹏程·丝路”是以中文为核心的多语言机器翻译平台,丝路系统自发布以来便为打破不同国家和民族之间的语言壁垒、实现无障碍的自由交流发挥着重要作用,新发布的2.0版本将继续为国际传播提供强有力的语言服务支撑。

4、鹏城·脑海

“鹏城·脑海”通用人工智能大模型以稠密型架构实现2000亿模型参数,依托“鹏城云脑Ⅱ”国产化人工智能算力平台进行全程预训练。该大模型采用MindSpore昇思国产化深度学习框架,构建出了一套涵盖中文、英文及50余个“一带一路”合作伙伴语种的多样化语料数据集和数据质量评估工具集。
“鹏城·脑海”大模型将进一步依托“中国算力网”接入的协同算力,以“算力网算力调度+模型赋能”相结合的方式,携手国家新一代AI公共算力平台,共同推动国产化AI大模型的持续演进与部署应用,最终打造一个基于“中国算力网”的各类领域AI大模型及应用生态的数字化基座。

3. 之江实验室

 
图片

整体介绍

之江实验室是浙江省深入实施创新驱动发展战略、探索新型举国体制浙江路径的重大科技创新平台,于2017年9月正式挂牌成立。实验室聚焦智能计算,瞄准国家战略前沿、科技创新变革、战略产业创新三大战略需求,打造国家战略科技力量,建设服务支撑浙江创新发展的策源地,成为世界领先水平的科技创新基地。
实验室现设有前沿基础研究中心、智能计算设施创新中心、数据枢纽与安全研究中心、高效能计算系统研究中心、天基计算系统研究中心、天文计算研究中心、生命科学计算研究中心、新材料计算研究中心、智能制造计算研究中心、新型计算传感与智能处理研究中心、智能装备研究中心等11个研究中心。

主要成员

之江实验室聚集了一批海内外优秀的科研人员、博士后研究人员,全职人才队伍达2000余人,致力于打造“主任科学家领街+领军人才担纲+青年人才主力”的创新团队。主要团队成员包括之江实验室主任王坚院士,前沿基础研究中心主任科学家袁小聪,智能教育研究中心主任黄宝忠,天机计算系统研究中心李超等。

主要成就

之江实验室的研究领域包括未来网络计算、泛化人工智能、泛在信息安全、无障碍感知互联和智能制造与机器人五个方向及智能云、工业物联网、大脑观测及脑机融合和量子计算研究四大装置。
之江实验室在很多领域取得了巨大的成就,比如天基领域的“东方慧眼卫星”,““天权”后量子密码平台”等等,至AI领域主要成就包括:

1、智库大模型写作助手

基于通用开源大模型的智库大模型,通过注入和融合智库研究的专业领域知识,具备辅助研究人员起草智库报告的能力。智库大模型写作助手能够将研究人员从大量信息和知识整理的基础工作中解放出来,而将主要精力放在核心思想凝练和创意迸发中。
智库大模型写作助手已经训练高质量的咨政类语料5万余篇,政策类语料24万余篇。丰富且高质量的语料积累,以及科学的训练方法,能有效提升模型的推理和生成能力。

2、“之江瑶光”智能计算操作系统

“之江瑶光”智能计算操作系统能够面向不同的计算任务提供相应的算法、函数或框架,避免重复开发和不兼容的问题。同时,系统具备算力聚合和数据编排调度的能力,可以让数据高效地到达计算集群和节点。
“之江瑶光”能够支持各种计算任务和各种应用场景,包括需要大规模算力的计算任务、数据驱动的计算任务、常规的和定制开发的计算任务,以及使用闲散算力的计算任务等等。
目前,基于“之江瑶光”,之江实验室已经形成了FAST@LAB智能计算天文平台、SATH智能计算制药平台、“之江神农”智能计算育种平台、“之江昆吾”智能计算材料平台、“之江天基”智能计算基因平台等。
其中,智能计算育种开放平台已经在中科院东北地理与农业生态研究院、中国水稻研究所进行育种应用;智能计算材料服务平台理论预测发现了三种热电阈值大于1的高性能热电材料,并通过实验验证。

3、“之江天目”异构智能计算机

面对人工智能的迅猛发展和算力需求的不断提升,自主可控的智能计算机成为行业风向标。之江实验室设计基于开放计算规范的千卡规模液冷智能计算机“之江天目”异构智能计算机。“之江天目”是专为人工智能应用构建的集群系统,算力规模达到110PFLOPS,能效比达到1.08,可支撑超千亿参数巨量模型的高效、并行训练,支持业界主流框架和模型,能够提供一站式的从训练、部署到推理的完整解决方案。

4、“之江朱雀”智能图计算平台

“之江朱雀”智能图计算平台是基于分布式内存计算的大规模高效图计算平台,集成了针对大规模多源异构数据的图分析算法、图交互式查询、图表示学习、图生成学习等计算能力,能够一站式赋能医药制造和生物育种等科学计算。在国际顶级图学习标准OGB(Open Graph Benchmark)挑战赛中,之江朱雀智能图计算平台摘得过OGB挑战赛全球冠军。

4. 北京智源人工智能研究院

 
图片

整体介绍

北京智源人工智能研究院(简称:智源研究院Beijing Academy of Artificial Intelligence,BAAI)是人工智能领域的新型研发机构。2018年11月14日,在科技部和北京市支持下,联合北京人工智能领域优势单位共建。
智源研究院的愿景和目标是按照国家新一代人工智能发展规划的总体部署,支持科学家勇闯人工智能科技前沿“无人区”。研究院将集合北京大学、清华大学、中国科学院、百度、字节跳动等人工智能领域优势单位,采用新的科研组织形式和人才引进培养模式。
研究院的工作重点包括构建创新生态、推动原始创新、培养引进高端人才,以及加强产学研合作。它还致力于建设开放服务平台,召开人工智能峰会,协调推进联合实验室和人才培养。

主要成员

主要成员包括智源研究院院长黄铁军教授,并汇集100多位世界级AI顶尖科学家,并拥有150多人的全职前沿研究及工程团队,共同推动AI技术的发展和应用。
智源研究院是国内AI领域人才的摇篮,包括 “智谱AI”创始人唐杰、“月之暗面” 的创始人杨植麟、“智子引擎”的创始人卢志武、 “聆心智能”的创始人黄民烈、 “深言科技”的创始人岂凡超、“面壁智能”的创始人刘知远、字节大模型核心成员杨红霞等等都曾是“悟道”大模型团队成员。

主要成就

2023年,微软总裁布拉德·史密斯在接受采访时表示,他们认为国际上有三家公司处于AI研究的绝对前列,一个是与微软合作的OpenAI,第二个是谷歌,第三个是北京智源人工智能研究院。
北京智源人工智能研究院是国内最早从事大模型研究的机构之一。在2020年GPT-3发布后,在北京的高校及企业的AI学者组织起来,共同推进中国大模型的建设。从四个方向开拓中国的大模型,包括中文大模型、多模态大模型、认知大模型与蛋白质大模型,依次为「文源」、「文澜」、「文汇」与「文溯」,统一代号“悟道”。

1、“悟道”人工智能大模型项目

2021 年 3 月, 「悟道1.0」首次面试。2023 年 6 月,在第五届智源大会上,「悟道 3.0」发布,包括「悟道-天鹰」系列语言模型、「悟道-视界」系列视觉及多模态模型。与「悟道 1.0」、「悟道 2.0」不同的是,悟道3.0不仅仅是大模型,而是一套大模型技术体系,还包括「天秤(FlagEval)」大语言评测体系及开放平台与 FlagOpen飞智大模型技术开源体系,体现了更为宏观的大模型发展视野。
悟道3.0系列中的悟道·天鹰Aquila语言大模型系列是首个支持中英双语、商用许可、并满足国内数据合规要求的开源语言大模型。包括Aquila基础模型,AquilaChat对话模型和AquilaCode“文本-代码”生成模型。
AquilaChat对话模型具有4项技能,回答准确、安全,生成速度快,并可通过调用其他模型增加功能,例如配合InstrucFace多步可控文生图模型编辑人脸图片。AquilaCode-7B成功实现小数据集、小参数量下的高性能,成为最优开源代码模型。

2、“天演”人工智能生命模拟工程

天演Evolution项目主要分为三个层次:基础层、应用层和理论层。基础层主要包括神经元模型、神经网络模型和神经系统模型三个子方向,旨在建立从单个神经元到整个神经系统的多层次、多尺度、多维度的仿真平台,实现对生物神经网络的精细模拟和高效运算。
应用层主要包括认知计算、脑机接口和类脑芯片三个子方向,旨在利用生物神经网络仿真平台,开发具有高效性能和低功耗特点的类脑计算设备和系统,实现对人类认知功能的增强和辅助。
理论层主要包括生命信息论、生命计算论和生命智能论三个子方向,旨在探索生命信息处理的本质规律和原理,建立从信息到计算到智能的统一理论框架,揭示生命智能的起源和演化。

3、九鼎智算平台

通用大模型、AI for Science已是国际AI领域公认的前沿重大科研方向,这些技术变革在兴起的同时,也带来了从硬件、平台、算法、应用到生态结构的新一轮挑战。
为此,智源研究院打造了专注AI科研的大型云计算服务平台“九鼎智算平台”,将围绕通用大模型、AI for Science等方向,通过解决科研核心瓶颈与挑战,推演计算新范式,从而为未来十年AI科研创新与产业化应用提供强大基座。
 
5. 小结
随着人工智能技术的飞速发展,我们正站在一个全新的科技革命门槛上,AI的发展也上升为国家战略。在此条件下,我国以浦江实验室、鹏城实验室、之江实验室及智源研究院等国家队力量,集结了顶尖的科研人才,投入巨大的热情和智慧,其不仅在基础理论研究上取得了突破,更在关键技术攻关和应用实践上取得了显著成就。
它们所推动的开源项目、大模型技术、智能操作系统、云计算服务平台等,不仅为国内外科研人员提供了宝贵的资源和工具,也为人工智能技术的产业化和应用落地奠定了坚实基础。
© 版权声明
THE END
喜欢就支持一下吧
点赞57 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

图形验证码
取消
昵称表情代码图片

    暂无评论内容