ChatGPT热潮背后的AI大模型:中国发展现状、未来机遇与挑战解析

随着ChatGPT风靡全球,其背后的大型AI模型也突然火了起来。大家都想知道,评价大模型水平的维度和标准是什么?

ChatGPT的推出让我们看到了中美在AIGC上的差距。那么,目前中国大型车型的发展现状如何呢?未来中国大型车型的发展将面临哪些机遇和挑战?

当前,我们正处于通用人工智能发展的关键时期。面对各机构自主研究大型模型的发展趋势,如何提高算力效率并有效避免低级重复?

一些业内人士担心人工智能会毁灭人类。这是没有根据的吗?如何才能将问题消灭在萌芽状态,让AI结果可预测、行为可控?

带着有关AIGC的种种疑问,腾讯研究院独家采访了中国工程院院士、我国通信领域权威专家邬贺铨。

【采访者】

牛福莲 腾讯研究院高级研究员

吴春玲 腾讯研究院高级研究员

王强 腾讯研究院高级专家

(以下简称T)

中国当前算力总规模对比美国:有差距但差距不大

T:有人说中国大型车型的发展比国外落后1-2年。您如何看待目前中国大型车型的发展?

邬贺铨:中国在大型车型的研制方面起步比美国晚。 ChatGPT发布后,国内多家单位纷纷表示正在开发生成式大模型。在美国,已知只有微软、谷歌等少数公司在研究大型模型。与美国相比,我国研发大型模型的单位比美国还多,但研究课题多并不意味着中国在大型模型上的研发水平很高。据说国内某大型模型的参数数量高达1.75万亿,超过了GPT-4,但目前还没有其应用的报道。虽然一些中国公司声称能够推出类似ChatGPT的聊天机器人,但目前在多语言支持方面还不如ChatGPT,而且在中文对话能力方面的响应速度方面仍然存在差距。

我国科技发展的优势_发挥科技优势_我国科技发展优势

我们现在只注意到ChatGPT,它的目标是生成任务,主要完成聊天、写作等语言生成。谷歌的BERT模型更注重判断和决策,强调问答、语义关系提取等与语言理解相关的任务。 BERT模型的技术也值得我们关注。评价大模型水平应该是多维度的,包括全面性、合理性、易用性、响应速度、成本、能源效率等。总体来说,目前我国大模型发展与国外差距的依据是1-2年不清楚。 ,现在下这个结论没有多大意义。

中国企业在获取中文资料、了解中国文化方面比外国企业具有天然优势。中国拥有最齐全的制造业门类,具备AIGC实业培训的有利条件。中国在算力方面已经具备了良好的基础。据OpenAI报告显示,训练GPT3模型所需算力高达3.64EFlops/天,相当于3-4个鹏程云大脑II(鹏程云大脑II为1Eflops,即100亿次浮点计算)每秒)。根据2022年底的数据,美国占全球算力的36%,中国占31%。与美国相比,现有算力总规模有差距,但差距不大。在以GPU和NPU为主的智能计算能力规模中,中国明显高于美国(根据2021年底数据,美国智能计算规模占全球智能计算总规模的15%,中国占26%)。我国不仅大型互联网公司拥有相当的计算能力,国家实验室和一些城市政府支持的实验室也拥有大规模的计算资源。可以说,中国也能提供训练大型模型所需的计算能力。据了解,鹏城实验室正在设计鹏城云脑III,其算力达到16EFlops,比GPT-3使用的算力高出3倍。预计耗资60亿元,将为人工智能训练持续提供强大算力支撑。 。

中国AIGC研发:需认清差距、关注挑战、创新

T:除了我们良好的算力基础之外,您认为我们在中国发展模型还面临哪些挑战?

邬贺铨:光有计算能力是不够的。我们还面临以下几个方面的诸多挑战:

首先,大模型的基础是深度学习框架。美国的Tensorflow和PyTorch多年来一直深耕深度学习框架生态。虽然国内企业已经自主开发了深度学习框架,但市场考验还不够,生态系统还有待构建。

其次,将 AIGC 扩展到工业应用可能需要多个大型模型。如何有效地集成多个大型模型提出了标准化和数据融合的挑战。

第三,大型模型需要海量数据训练。中国有几千年的文明,但大部分丰富的文化遗产并没有被数字化。 ChatGPT 训练使用的语料库中,中文占比不到 0.1%。我国互联网企业虽然拥有大量的电子商务、社交、搜索等网络数据,但各自的数据类型还不够全面,网络知识的可信度缺乏严格的保障。中国的培训语料库还需要大量的挖掘工作。

第四,大模型训练所依赖的GPU芯片,以NVIDIA的A100芯片为代表。不过,该芯片已被美国限制向中国出口。国产GPU的性能还有待进一步测试。目前,算力的利用效率还存在差距。差距。

第五,我国从事人工智能研究的技术人员不多,但具有架构设计能力和AIGC数据训练提示技能的人才仍然短缺。在ChatGPT出现之前,有人认为中国在AI方面的论文和专利数量与美国相当。 ChatGPT的推出让我们看到了中美在AIGC上的差距。现在我们需要清醒地认识和关注我们所面临的挑战,并做到真正的创新,将挑战转化为机遇,在新一轮的人工智能赛道上做出中国的贡献。

建议开放国家算力平台,支持各类大型模型训练

T:ChatGPT 无疑是一个巨大的创新。未来中国应该如何鼓励这样的创新?应该做什么样的工作?

邬贺铨:人工智能从判别式到生成式的发展是一个里程碑式的创新,已经开始进入通用人工智能的轨道。从GPT-3到GPT-4,文本输入发展到部分图形输入,即增加了理解图形的能力。在此基础上,实现支持多模态数据输入的深度学习架构和通用模型就不远了。但大模型的任务泛化以及大模型按需调用的精细化仍然需要更大的投入和创新。无标签数据和图形视频的无监督学习比语言和文本输入困难得多。

我国科技发展优势_我国科技发展的优势_发挥科技优势

当前,我们正处于发展通用人工智能的关键时期。对于我国来说,这是一次难得的跨越式发展机遇,也是一次严峻的挑战。算力、模型、数据是ChatGPT成功的必要条件,也将是通用人工智能成功的关键因素。此外,创新生态、机制、人才更为关键。我国总算力与美国相当,但跨数据中心算力协作仍面临制度挑战,不少智能计算中心算力利用率和效率较低。许多单位独立研究大型模型,不可避免地导致低水平重复。建议在国家科技与产业规划协调下,合理分工,形成合力。建议开放国家实验室算力平台,支持各类大型模型训练。比如鹏城云大脑现在对外开放的算力已经达到总容量的3/4,可以支持相当于GPT-3的2000亿参数的开源中文。预训练的大型语言模型。还建议组建算力联盟,池化现有高端GPU计算资源,提供大模型数据训练所需的算力。目前,鹏程实验室主要建设的“中国计算网络(C2NET)”已接入20多个大型智能计算、超级计算、数据中心,汇聚异构算力达到3EFlops。其中,自主研发的AI算力超过1.8EFlops。此外,聊天机器人的应用只是训练和测试AIGC的直观方式,但聊天并不是硬性必需的。各种面向行业应用的模型都需要在大模型的基础上进行开发,让大模型尽快在行业落地,在各行各业发挥作用。培养更多行业应用人才。

大模型行业应用需要既懂行业技术又懂人工智能训练的综合型人才。

T:到目前为止我们已经看到了ChatGPT在某些领域的应用,比如聊天机器人、文本生成和语音识别。未来在实际行业和领域是否有应用机会?大模型在实体行业的应用还面临哪些障碍?

邬贺铨:在现有ChatGPT聊天机器人的基础上,通过培训补充相关行业和企业知识,可以承担企业中的智能客服工作,代替工人为客户提供售前和售后服务。在需要软件编程的设计和制造过程中,ChatGPT可以代替程序员完成编程任务并检测软件bug。可以承担设计和生产过程所需文件的收集、翻译和整理工作。经过专业培训后,AIGC大模型可以用于设计EDA软件,例如IC设计的工具软件。在动漫游戏公司,基于AIGC大模型训练的机器人可以根据提示编写脚本、创建游戏脚本和程序,完成3D动画的渲染。

但ChatGPT并不是通用模型,很难直接应用到实体工业的制造过程中。但可以基于ChatGPT的训练原理,利用行业和企业的知识图谱进行深度训练。有可能开发出专门为企业服务的大模型来完成这项工作的挑战,就是需要熟悉企业上传流程和关键环节技术、掌握人工智能大数据训练技术的人才。

从注重结果到注重过程,科技与法制融合,引领AIGC推理进程

T:ChatGPT也会出现各种错误,这也会带来一些伦理、安全和隐私方面的问题。未来应用大模型时,如何营造一个既包容又兼顾安全和发展的环境? ?

邬贺铨:生成式人工智能的出现,将社会对人工智能的关注度推向了前所未有的高度。在引发科学界和工业界人工智能研究热潮的同时,不少专家担心人工智能会毁灭人类,呼吁叫停GPT-5。研究。一些专家的担忧并非没有根据,因为ChatGPT机器人目前的思维过程是不透明的。人类创造了ChatGPT,但目前人类还没有完全理解它的推理过程。推理结果已知而不知道为什么,可解释性不足、不确定,不可知性会导致不可控,存在机器人异常、道德失败、行为失控的风险。

解决办法不是停止人工智能的研究,而是将AIGC研究从注重结果转变为注重过程,设计并主导其推理过程,使结果可预测,行为可控。未来大模型的推广应用需要有资质的机构进行安全可信的评估,并且大模型的推理过程经过验证后是可追溯的。同时,要建立相应的人工智能治理法规,防止AIGC培训误导,追究AIGC培训主体责任,严惩煽动、教唆邪恶犯罪的人员。通过技术与法律体系的互补,人工智能成为人类真正忠实的助手。

本文来自微信公众号,作者:滕岩独家专访,36氪授权发布。 (原标题:《腾岩独家专访|邬贺铨院士:中国大模型发展的优势、挑战与创新路径》)

上一篇:忍不住想刷手机?来必胜公考刷题吧!精选5道真题等你挑战 下一篇:手机的利与弊:21世纪高科技时代的双刃剑影响分析
标签:
分享到:

相关文章

    最新文章
    热门
    最新推荐