大模型渐入冷静期 腾讯终于披露通用大模型进展

8月3日,腾讯集团披露在通用大模型领域进展。

腾讯表示,从零开始、完全自研的腾讯混元大模型目前已经进入公司内应用测试阶段。此前,腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等多个腾讯内部业务和产品,已经接入腾讯混元大模型测试并取得初步效果,更多业务和应用正在逐步接入中。腾讯将不断升级迭代,持续优化大模型能力,在条件成熟后,为行业和客户更好地提供服务。

此前在接受记者采访时,腾讯内部技术人员普遍对腾讯通用大模型进展持缄默态度,称内部对大模型动态会有统一口径,不会单独披露。


(资料图片)

至于通用型混元大模型未完全面向公众开放的原因,腾讯CEO马化腾此前回应称,“我们最开始以为这是互联网十年不遇的机会,但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇。AI非常重要,但这的确需要有很多的积累”,“对于工业革命来讲,早一个月把电灯泡拿出来,在长的时间跨度上来看是不那么重要的。关键还是要把底层的算法、算力和数据扎扎实实做好”。

财报交流会上,腾讯总裁刘炽平表示,腾讯对AI一直有所布局,腾讯最主要的观点就是认为 AI 及大模型对于腾讯整个业务来说是一个增长的扩大器。腾讯过去一直有利用 AI 技术落地内部业务去提高整体效率,推动业务发展,例如广告游戏、短视频及云业务等。

另外,刘炽平表示,腾讯的业务并不是那么容易被大模型等技术颠覆,但可以通过该技术去进一步提升用户体验。例如在游戏业务部分,目前很难通过AIGC直接创造一个游戏,但在游戏的创造过程当中,可以通过AIGC 提高创作效率,这就是腾讯业务组合会在大模型潮流里的获益。

腾讯方面此前披露更多的是产业大模型进展,称正依托腾讯云TI平台打造行业大模型精选商店,为客户提供MaaS(Model-as-a-Service)一站式服务。

自从ChatGPT掀起大模型的热潮,如何将大模型能力应用到自身的行业和场景里,以及如何解决成本、数据、安全等大模型实际落地难题,成为行业关注的焦点。在腾讯方面看来,依据企业实际需求,进而定制一个专属大模型,或许是解决这些问题的答案。更进一步来看,产业大模型需要整个行业共建投入,腾讯CSIG(云与智慧产业事业群)CEO汤道生表示,生态共建是AI发展的有效路径。

自ChatGPT热潮后,国内AIGC板块在6月19日涨至高点,随后一路下挫,市场进入回调冷静期,资本与创业者也将更多注意力集中于如何通过大模型实现商业化落地。通用大模型平台提供API接口或开源是主要的可选方式。

今日,阿里AI模型社区魔搭ModelScope上架两款开源模型Qwen-7B和Qwen-7B-Chat,阿里云确认其为通义千问70亿参数通用模型和对话模型,两款模型均开源、免费、可商用。7月,Meta宣布将与包括微软在内的主要云计算服务提供商合作,推出新一代开源大模型Llama 2,并将该模型免费开放给商业和研究机构使用。

当开源选择逐渐增多后,大模型平台之间的竞争也将越发激烈,据第一财经记者了解,国内目前的大模型平台主要先提供开源商用的选项,但真正铺展开需要等待相应监管政策落地之后。

7月10日,中国证监会科技监管局局长姚前在《中国金融》发文表示,目前国内外主流大模型在算法层面尚不存在代际差,但在算力和数据方面存有差距。建议在通用领域大力支持国内头部科技企业研发自主可控的国产大模型,同时鼓励各垂直领域在大模型基础上,利用开源工具构建规范可控的自主工具链,既探索“大而强”的通用模型,又研发“小而美”的垂直行业模型,从而构建基础大模型和专业小模型交互共生、迭代进化的良好生态。

关键词: