手机是一种娱乐设备,但如果你想完成一些事情,它就不是效率最高的机器。
图片来源:由无界 AI生成
在 CES 2024 上,支持人工智能的小玩意儿可谓是琳琅满目,而 rabbit r1 之所以能够脱颖而出,不仅是因为其高辨识度的工艺和独特的外形,还因为它的执着追求。该公司希望人们随身携带第二台设备,以省去打开手机的麻烦。
售价 200 美元的 r1 背后的理念很简单:在需要完成一些简单的任务时,比如打车,或找个聚餐的地,我们可以不用掏出手机,一个简单的命令,可爱的“兔子”就会替我们行动起来。
创始人兼首席执行官 Jesse Lyu 称:“我们不是要扼杀手机。”“手机是一种娱乐设备,但如果你想完成一些事情,它就不是效率最高的机器。比如安排与同事共进晚餐,我们需要四五个不同的应用程序协同工作。大语言模型是自然语言的通用解决方案,我们希望为这些服务提供通用解决方案。”
不用再掏出手机、解锁、找到应用程序、再打开它然后在用户界面上操作(太费劲了!),直接掏出 r1,用自然语言向它发出指令:
“叫一辆 Uber XL 带我们去现代艺术博物馆”。
“给我列出步行 10 分钟内的五家便宜餐馆”。
“在 Airbnb 上列出海滨 10 英里内最适合六个成人的小屋,每晚不超过 300 美元”。
然后,R1 就会按照要求去做,几秒钟后就会给到信息进行确认。
是的,这其实很像我们所谓的“人工智能助手”在过去五六年里一直在做的事情。就像“hey Siri”。但是,现在的 AI 助手有着巨大的区别。
Siri、谷歌助手、Alexa 以及其他所有产品都更适合被描述为“自定义小应用程序的语音界面”,而完全不像我们许多人从去年开始使用的聊天语言模型。如果你让谷歌帮你叫一辆 Lyft 到你的当前位置,它会使用 Lyft 官方 API 发送相关信息,并得到回复 -- 这基本上就是两台机器在对话。
虽然这并没有什么不妥,但通过 API 所能做的往往非常有限。而且,助手和应用程序之间必须有正式的关系,即经过批准的付费连接。如果你喜欢的应用无法与 Siri 兼容,或者 Alexa 可以访问的 API 已经过时,那就没戏。而一些小众应用规模太小,无法与谷歌达成官方协议,又该怎么办?
rabbit 所设计的产品更像是去年出现的“代理”型人工智能,即在网站和应用程序等普通用户界面上训练出来的机器学习模型。因此,它们不是通过达美乐专门的应用程序接口(API),而是像人类一样,通过点击普通网站或移动应用程序上的普通按钮和字段,就能订购披萨。
该公司在无数常见应用程序的屏幕截图和视频上训练了自己的“大型动作模型”或 LAM,因此,当你让它在 Spotify 上播放鲍勃 - 迪伦(Bob Dylan)的旧专辑时,它也知道如何进入迪伦的艺术家页面,按发行日期整理专辑,然后向下滚动,播放一张最老的专辑。
你可以在官方演示中看到这一操作。
那么,如果是一个 r1 不知道的应用程序呢?rabbit 称 r1 可以通过观察你使用该应用程序来学习 -- 不过这种教学模式不会在发布时提供。(Lyu 表示,他们在《暗黑破坏神 4》中已经实现了这一功能,所以它可能可以处理 AllTrails)。
当然,r1 无法独立按下应用程序中的按钮,一来它没有手指可以按,二来它也没有账号。针对第二个问题,rabbit 建立了一个所谓的“rabbit hole”,在这个平台上,用户可以用登录凭证激活服务,但这些凭证不会被保存。激活后,服务器就会像你一样使用普通的按键来操作应用程序,不过是在某种模拟环境中。
Lyu 说:“把它想象成把你的手机递给你的助手,”“我们要做的就是让这个东西帮你按键。它们在后端看到的只是你在尝试做事情。这是完全合法的,也符合服务条款。”
更小、更便宜、更快
显然,rabbit 在技术方面下了不少功夫,但真正的问题是,除了手机之外,是否有人真的愿意随身携带这么个东西。它的售价是 200 美元,无需订阅,但需要提供 SIM 卡。相比于 AirPods,r1 便宜,而且也有很多有趣的功能。
另外,它的一个明显优势是外观。它是由瑞典消费电子公司和制造商 Teenage Engineering 设计的,要知道这家公司做出了很多好物。
你可能会问,为什么要在一个可以通话的东西上装一个屏幕?因为屏幕可以显示可视化信息,比如搜索结果或确认你的位置。有些人可能会问,既然一开始就需要确认这些东西,为什么不直接用手机呢?
显然,rabbit 的工作人员认为,把这个小巧(3 英寸 x3 英寸 x0.5 英寸)、轻便(115 克)的小工具拿起来,说出你想要的东西,然后使用滚轮和按钮来浏览结果,在很多情况下比使用应用程序更简单。的确,现在许多应用程序都设计得很烂,有些还有广告危险。
那么为什么又要添加相机呢?据悉,r1 有一个有趣的磁性/自由浮动轴,因此旋转起来可以保持水平,并指向任何你想要的方向。或许,rabbit 还有一些功能尚未准备就绪,比如测量卡路里或者询问“这栋建筑是谁设计的?”等等。视频通话和社交媒体功能可能即将推出。
目前,这款设备已开放预订,Lyu 说他们的目标是在三月底向美国地区的买家发货。(之前大火的 Humane 也宣布 AI Pin 将于 3 月开始发货。)
可怕的竞争
不过,最终的问题并不在于 rabbit r1 能否成功实现目标,而是在面对极其强大的竞争时,这种方法是否可行。
谷歌、苹果、微软、OpenAI、Anthropic、亚马逊、Meta-- 它们中的每一家以及许多公司每天都在努力创造更强大的机器学习代理。对 rabbit 来说,最大的危险不是没有人买它,而是在六个月内,一家市值千亿美元的公司制造出了自己的行动代理,它能做到兔子所做事情的 80%,而且可以在智能手机上免费使用。
对于这个问题,手下只有 17 名员工的 Lyu 回答说:“我们当然担心,我们是一家初创公司。但他们能做到这一点并不意味着我们就要停下脚步。”
他指出,尽管这些公司拥有庞大的资源,但它们也缺乏初创公司的灵活性,同时也缺乏数据。他指出,语言模型只是“基于一个开放的配方 -- 五篇论文,仅此而已”。“在这方面几乎没有机会形成护城河。但 rabbit 的 LAM 建立在专有数据的基础上,针对的是特定设备上的特定用户体验。”
即便如此,即使 rabbit r1 更好或更可爱,人们还是更喜欢简单和方便。既然一台设备就能完成大部分任务,人们又为什么还要花钱买第二台设备呢?在短期内,这一问题答案是肯定的,Lyu 说预售订单已经堆积如山。那么,rabbit 还能生产下一代产品(大概是 r2)吗?即使不能,这款炙手可热的小设备也会作为人工智能热潮中一个雄心勃勃的典范留在我们的记忆中。
原文作者:Devin Coldewey
文章来源:https://techcrunch.com/2024/01/09/can-a-striking-design-set-rabbits-r1-pocket-ai-apart-from-a-gaggle-of-virtual-assistants/
编辑:web3528btc 来源:加密钱包代币