谷歌实验室宣布对其Gemini Pro人工智能工具进行重大升级,该工具是一款中型人工智能模型,为其聊天机器人的免费版本提供动力,可预览处理多达100万个代币。它提供了前所未有的“上下文大小”,使当前领先的工具及其128K容量付诸东流。
Gemini Pro v1.5的升级使其理论上比OpenAI的付费GPT-4模型强大700%,并在大型语言模型(LLM)中为计算语言学和机器学习树立了新的基准。
根据谷歌的说法,这个数字是“任何大型基础模型中最长的上下文窗口”。
谷歌实验室团队分享道:“在今天之前,世界上公开可用的大型语言模型的最大上下文窗口是20万个令牌。我们已经能够显著增加这一数量——持续运行多达100万个令牌”。
有了这一功能,Gemini Pro将比当前Gemini系列中最强大的版本以及目前可用的任何其他LLM更有能力。然而,这一背景是出于测试目的而上线的,而Gemini Pro即将推出的稳定版本将处理多达128K个代币。
虽然此次发布将是对Gemini 1.0可以处理的32000个代币的重大升级,但用户将不得不等待,看看100万个代币能做什么。
此举是谷歌在争夺人工智能行业霸主地位的竞赛中的最新攻势。上周,Gemini Advanced成为ChatGPT Plus的第一个可靠竞争对手。与Anthropic的Claude不同,谷歌的聊天机器人是多模式的,在不同的测试中提供了良好的结果,并提供了一系列OpenAI没有的功能。
然而,Gemini Advanced将赶上GPT-4.5 Turbo,后者已经处理了128000个代币。
Gemini 1.5的多功能性通过多次演示得到了生动的展示。谷歌表示,它“可以一次性处理大量信息,包括1小时的视频、11小时的音频、3万多行代码或70多万字的代码库。”
“在我们的研究中,我们还成功测试了多达1000万个代币。”该团队补充道。
一个缺点是:Gemini模型无法分析PDF文件,Decrypt在比较Gemini和ChatGPT时指出了这一缺陷。
“专家混合体”将继续存在
Gemini 1.5与其以前版本的另一个区别是使用了Mixed of Experts,这与Mistral AI用于制造更轻量化模型的技术相同。Mistral的参赛者足够强大,足以击败GPT 3.5,一跃成为最佳开源LLM的上层。
谷歌在其公告中分享道:“(专家混合)将您的请求路由到一组较小的‘专家’神经网络,这样响应速度更快、质量更高。”谷歌表示,这确保了响应不仅更快,而且更高质量。
就像Mistral一样,谷歌也能让自己的模式大放异彩。与Gemini Ultra 1.0相比,Gemini 1.5 Pro在几个基准测试中表现出了卓越的性能,这表明谷歌LLM的未来充满希望。
谷歌首席执行官桑达尔·皮查伊今天在一篇博客文章中表示:“它在多个维度上都有了显著的改进,1.5 Pro在使用更少计算的同时,实现了与1.0 Ultra相当的质量。”。
该公告没有提供Gemini Advanced 1.5的发布时间表。与此同时,OpenAI正在积极开发GPT-5。Gemini增强的代币处理能力将有助于巩固谷歌在人工智能军备竞赛中的地位。
由Ryan Ozawa编辑。
编辑:web3528btc 来源:加密钱包代币