中国已有79个10亿参数大模型,业界呼吁尽快建立自主创新“护城河”
“据不完全统计,中国10亿以上参数规模的大模型已经发布了79个,从地区来看北京和广东最多,自然语言处理是大模型研发最活跃的领域。”在中关村论坛上,中国科学技术信息研究所所长,科技部新一代人工智能发展研究中心主任赵志耕披露了中国人工智能大模型的情况。
今天人工智能领域的竞争比以往任何时候都更加激烈。有人把近日扎堆的大模型创业称作“百模大战”,从百度文心一言、阿里通义千问到商汤、昆仑万维等推出大模型,到王小川的百川智能、王慧文的光年之外、李志飞的序列猴子等,“中国版ChatGPT”在近几个月里几乎迎来扎堆发布的热潮。而在大模型的应用层,已有包括在线办公、金融科技、在线教育等多个细分垂直领域公布了大模型领域进展。
(资料图)
创新工场董事长、首席执行官李开复在论坛演讲中表示,AI大模型是一个绝对不能错过的历史机遇, AI大模型已经慢慢走向实体经济,它会改写每一个应用,重构人类的工作,很多重复性的劳动会被取代。
论坛过后,有参会嘉宾被记者问到如何看待如火如荼的大模型创业潮时,评价“这说明中国企业非常热情”,又补充一句:“像在炼丹。”
北京、广东大模型数量最多
赵志耕表示,从全球大模型发展态势来看,美国谷歌、OpenAI等机构不断引领大模型前沿的技术方向,同时欧洲、俄罗斯、以色列等越来越多的研发团队也在加入到大模型的研发中。
从全球已经发布的大模型分布来看,中国和美国超过全球总数的80%,美国在大模型数量居全球之首,中国从2020年进入大模型快速发展期,目前与美国保持同步增长态势。
根据中关村论坛上发布的《中国人工智能大模型地图研究报告》,中国人工智能大模型的地域分布明显特点,14个省市地区都有开展大模型研究,其中北京和广东最多,北京有38个大模型,广东有20个大模型。
在模型领域分布上,自然语言处理仍是目前大模型研发最活跃的重点领域,其次是多模态领域。计算机视觉和智能语音等领域仍有待进一步突破,目前模型较少。
如果大模型的生成式AI诞生过程比作“炼丹”,那么作为GPU的算力就好比炼丹炉下燃烧的烈火。报告通过调研全国范围内的算力基础设施分布情况发现,北京、广东、浙江、上海等地的大模型数量最多,同时这4个地方也是近三年人工智能服务器采购数量最高的地区,表现出非常明显的强相关性,为大模型研发应用提供了重要支撑。
在发表相关论文方面,中国大模型通过学术论文发表方式已经形成一定学术影响力。其中北京、广东、上海三地不论是论文发表量还是引用量都居国内最高,体现出明显的人才储备优势,江苏、广东、上海也是大模型人才相对较多的地区。
开源创新生态方面,目前已经有超过半数大模型实现开源。北京、广东、上海三地开源数量和开源影响力均居国内前三,这背后主要是高校和机构在推动,如清华大学的ChatGLM-6B、复旦大学的MOSS以及百度的文心系列大模型开源等。
大模型人才稀缺、原始创新不足
人才为大模型研发提供关键智力要素支撑。但从数量上看,目前各地大模型人才总量仍然稀缺,数量均不充足。
李开复在谈到当前AI大模型面临的挑战时,也提到包括需要质量更高的数据、需要更多的AI工程师与AI科学家等。
此前拉勾招聘发布的《2023第一季度AIGC人才供需报告》显示,2023年第一季度,AIGC人才招聘需求连续三月攀升,今年3月AIGC人才岗位需求量环比增加42%。在招聘平台上,不少企业甚至开出百万年薪以抢夺AI技术人才。
而中国的大模型自身也需要不断打磨。在推动开源开放的同时,多位业内人士都提到中国还需要加强基础研究,“自主创新是发展大模型的必经之路。”
李开复提到,要支持开源,但中国大模型公司不能过度依赖开源模型。“需要尽快建立自己的IP(知识产权)和技术优势,形成护城河。”因为开源模型无法达到国外大厂自研模型的性能,它的能力会成为“天花板”;同时海外大厂的开源技术还有关闭风险。而且,由于国内外文化、用户习惯和法律法规不同,将在国外训练好的模型带到国内进行微调是存在风险的。
中国工程院院士戴琼海也表示,目前我国人工智能领域应用强,但原始创新不足,在基础性技术和人才方面与美国相比处于弱势。戴琼海建议,我国应从政策、机制和投入上深化人工智能的人才培养和基础研究,强化原始创新。
此外,尽管国内大学、科研机构、企业等不同创新主体都在积极参与大模型研发,但学术界与产业界之间的联合开发相对较少。赵志耕提到,“我们观察到合作收缩趋势,这是接下来需要注意的。”
她建议,要加强资源和研发力量的统筹,促进大模型的有序发展, 例如加强智算中心、超算中心、云计算中心等计算资源的统筹。与此同时,同时加快基础研究和技术创新,提升学术和开源影响力。
她还强调了强化国际合作,积极参与全球人工智能治理的重要性。各国对于AIGC合规性的重视正在推动相应的监管措施出台。今年4月中国国家互联网信息办公室发布了《生成式人工智能服务管理办法(征求意见稿)》。赵志耕表示,希望这些治理原则和伦理规范能够在大模型的全链条中落地生根。在增进共识的基础上,加强人工治理的全球合作,创造中国的智慧和治理方案。有从业者指出,要参与规则的制定,中国的大模型要先上牌桌,才能拥有话语权,才有全球竞赛的入场券。