原文来源:中国企业家杂志
记者 赵东山
图片来源:由无界 AI生成
人均年薪100万,什么样的行业具备如此优渥的待遇?
答案是AI大模型。这是vivo副总裁周围接受《中国企业家》等媒体采访时给出的答案,他表示,“vivo大模型现在每年20亿~30亿元的投入成本,总投入成本已经超过200亿元,人才和数据算力各占一半,人才成本平均每人税后100万元。”
过去一年,AI大模型席卷整个互联网科技行业,当大模型完成从0到1的基础建设后,基于不同场景的大模型应用正在成为新一轮的竞争点,而拥有庞大用户基数的智能手机厂商成为最早一批端侧大模型的抢滩者。
从2023年8月起,国内头部智能手机厂商华为、小米、vivo、OPPO、荣耀相继公布了大模型研发和落地计划。
今年8月,华为鸿蒙OS 4率先宣布接入盘古大模型;小米紧随其后,目前已训练出13亿和60亿参数规模的语言大模型,并在小米澎湃OS系统和人工智能助手小爱同学的部分场景已经得到应用。
到了11月,手机厂商的大模型发布节奏越发密集。11月初,vivo一口气发布十亿、百亿、千亿级别三个参数量级的五个大模型矩阵;随后,OPPO正式推出自主训练的安第斯大模型(AndesGPT),并接入最新操作系统ColorOS 14,AndesGPT支持从十亿至千亿多种不同参数规模模型。
手机厂商入场的心态绝不只是“重在参与”,而是真金白银地大规模投入。今年4月,小米组建大模型团队时,雷军就表明态度:“全力支持,投入不设上限。”目前,小米内部在做AI相关的研发人员超过3000人;向来低调的vivo创始人、总裁兼CEO沈炜也向团队表示,“未来,AI将成为科技创新的底层技术。我们必须抓住这次历史机遇,以高规格地投入,来打造引领行业的技术和产品,为智能时代的到来做出我们的历史贡献。”
毫无疑问,在智能手机出货量下滑,用户换机周期不断延长,同质化竞争严重的当下,端侧大模型正在成为手机行业创新的新增量。但与此同时,如何将参数十亿、百亿的大模型内置到手掌大小的手机中,以及能为手机企业带来哪些实质变化,也面临着重重考验。
挑战
手机企业要想真正将大模型内置到巴掌大小的手机中,其中就有个悖论:如果模型参数太大了,则手机端侧根本就放不进去或跑不起来;但是如果模型太小了,可能又无法真正实现智能涌现。
端侧大模型在落地执行中,一个无法忽视的现实是,10亿参数的数据在手机上会占用1G的内存,70亿参数的数据则会占用4G内存,而当数据量达到130亿参数时,内存占用达到7G。然而,现在市面上绝大多数高端手机的运行内存是12G或16G,如果大模型的数据量达到130亿参数则意味着会占用掉7G的内存,这将严重影响手机的运行流畅度。
但相比云上大模型,端侧大模型的优势又显而易见,比如可以充分保护用户的隐私,在用户使用过程中,用户和大模型的交互数据不用上传到云端。与此同时,端侧大模型的响应速度会更快,一种最极端的情况就是即便在没有网络的情况下,端侧大模型依然可以使用,而云上大模型在没有网络情况下则无法使用。
此外,云上大模型的调用成本高昂。“一次大模型云端计算的最低成本是1.2~1.5分人民币,若3亿用户每天用十次,意味着手机厂商一年要多出100多亿元的支出。”一位AI大模型从业者告诉《中国企业家》。
因此,在现有的模型训练水平基础上,摆在手机厂商面前的是人才和技术积累的挑战,只有聚集到核心的技术人才,才能更好地解决这一困境,手机大模型之战也在某种程度上意味着是人才和资金投入之战。
周围告诉《中国企业家》,自2017年组建AI全球研究院,vivo已经组建了1000人以上的AI专家团队,每年在人工智能上的投入保守估计在20亿~30亿元,目前已经超过200亿元,其中,数据、算力成本占自研大模型投入的一半,人员成本占了一半。
小米在人工智能上的布局同样比较早,2016年AlphaGo出来之后,雷军就开始大力投入AI,最开始是视觉团队,后来逐渐拓展到AI的各个领域。
“小米有3000多人在做AI相关的研发工作,小米AI实验室在视觉、声学语音、NLP、知识图谱、机器学习等方向,都有技术积累,从算法预研到工程落地具备很强的闭环能力。我们之前有一个人机对话团队,做过28亿参数的对话模型。”小米集团AI实验室主任、自然语言处理(NLP)首席科学家王斌表示。
除了手机厂商在努力布局大模型之外,智能手机的上游芯片制造商也正在加入这场战争。
2023年10月25日,高通发布新一代移动处理平台骁龙8 Gen3。与上一代产品骁龙8 Gen2相比,骁龙8 Gen3不仅GPU、NPU性能大幅提升,更重要的是,它可以在终端侧运行100亿参数的模型。
高通着重在骁龙8 Gen3上提升了其芯片的AI计算能力,NPU性能大涨98%以上,在支持运行最高100亿参数的模型外,还能够运行每秒生成高达20个token(大模型中文本的最小单位)的70亿参数大语言模型。这意味着,各类虚拟助手、GPT聊天机器人未来都能在手机等终端运行。
落地
《中国企业家》观察发现,几乎所有的智能手机厂商在布局大模型时都采用了渐进式开发的路线,即先研发和训练小参数规模的模型,等到把路上的坑都蹚一遍,再研发更大参数规模的模型。
关于不同级别模型的能力表现,周围告诉《中国企业家》:“据内部测试,70亿参数的大模型足够做好简单的文档摘要和拆解的功能,但要想真正实现‘智能涌现’, 70亿参数的大模型任务拆解能力还有提升空间,130亿参数可能是更好的选择。”
除了渐进式开发外,截至目前,智能手机厂商布局大模型也分为两条路径:第一,采用轻量化和本地化部署的手机端侧大模型,典型厂商如小米和荣耀;第二,采用云、端协同的架构设计,推出一个大模型矩阵,在云端部署百亿、千亿级别的大模型训练模型,在手机端侧部署十亿级别的大模型,典型厂商如华为、vivo和OPPO。
2023年4月,王斌牵头负责,小米技术委员会AI实验室大模型团队负责人栾剑带队,小米内部正式成立了一支自研大模型团队,雷军亲自推动了自研大模型团队的建立,并全程高度参与了小米大模型的自研,他会亲自查看团队的周报、月报甚至日报,关注大模型进展。
小米自研的端侧大模型,更强调跟产品的结合和场景的驱动。“小米大模型技术的主力突破方向为轻量化、本地部署,我们不会纯从技术角度考虑,也不会以比赛为目标。我们不搞军备竞赛,小米做大模型的出发点并不是成为中国的OpenAI。我们一开始就考虑大模型跟公司的场景怎么结合。”王斌告诉《中国企业家》。
与小米主要布局端侧大模型不同,华为、vivo、OPPO自研大模型则采用“云、端协同”路径,华为的盘古大模型、vivo的蓝心大模型以及OPPO的安第斯大模型,均覆盖十亿、百亿、千亿多个参数量级。
“为什么要用矩阵来解决这个问题?因为今天的大模型叫语言大模型,只有语言和文字才有真正的大模型,声音、视频是没有大模型的。在我能想象的算法没有出现极大突破之前,矩阵式是比较好的解决方案。”周围在接受采访时表示。
此外,周围也表示,矩阵式大模型也是受到用户需求和算力成本影响的综合结果。第一,矩阵模式可以让用户在云上使用大模型的同时,在端侧本地化运行关键数据,满足隐私及安全需求;第二,矩阵模式可以有效平衡云端算力成本过高的问题。
必须
纵然手机端侧大模型困难重重,但参与其中正在成为手机厂商的必须。
2017年,智能手机市场迎来了有史以来的首次下跌,以中国市场出货量下滑5%为节点,宣告智能手机行业进入存量时代。2023年第三季度,全球智能手机出货量同比下滑8%,出现连续9个季度的衰退,同时也创下了近十年同期出货量最差纪录。
过去数年中,面对越来越同质化的竞争,手机厂商们先后在快充、续航、全面屏、摄影、高刷新率等领域展开创新与内卷。当下,端侧大模型正在成为他们渴望抓住的创新入口。毕竟,谁也不想因为错过某一个风口而成为下一个诺基亚。
“AIGC是我做手机以来,最让我兴奋的一个技术的创新,甚至可以说是革命。它会为移动生活的体验带来革命性的变化。大模型的知识超出了个体的知识,它可以像一个人一样理解你的语言,每天观察你、学习你、了解你的习惯,给你最好的帮助,完成你的任务。”谈及大模型时,OPPO首席产品官刘作虎告诉《中国企业家》。在他看来,未来手机就是一个超级助理,与ChatGPT有异曲同工之妙。
手机厂商的大模型也正在逐步落地到其人工智能应用中,比如,华为P60和Mate60系列手机的小艺智慧助手已经接入盘古大模型。与此同时,OPPO的小布、小米的小爱同学等均已接入各自的大模型。此外,在vivo最新发布的X100机型中,明确为用户提供了端侧大模型的下载选项功能,用户可自愿选择是否下载,也可选择在云上还是本地运行。
手机端的大模型应用也确实在改善用户的使用体验。比如以往要找到图库中的某一张照片,需要非常精确地搜索关键词,但是在大模型时代,只需告诉AI语音助手 “之前去xx旅游时拍的长城的照片”这样的泛化模糊指令,就能找到相应的照片。
目前大模型在端侧已经可以执行语言理解、文本创作、图片生成等简单的操作,但涉及到订票、APP交互、设备控制等操作仍需调动云端大模型能力。但即便如此,对于手机厂商来说也是巨大的可能性。
“我们现在就是抱着《孙子兵法》中‘先为不可胜’的心态在高饱和地投入,就是不希望被优秀的商业伙伴拉开距离,而不是一定要在大模型上进行内卷或者对抗和竞争。”谈及做大模型的心态时,周围告诉《中国企业家》。
在他看来,端侧大模型的重要性跟通信、芯片是同一个级别的,未来还将变成获取高端用户的一个关键途径。“如果从科技巨大的生产效率的提升来看,我认为大模型也是一个历史性的、事件级的,通过做好大模型之后,获得更多高端用户的认可,这是必然的,所以我们也在高规格地来投入。”周围补充道。
在国产手机集体喊出冲击高端的当下,一切新的创新机会点都成为竞争的新变量。何况,端侧大模型的战役已经打响。
编辑:web3528btc 来源:加密钱包代币