「日常工作不会有任何变化,OpenAI 的使命是不变的。」
编译:阿法兔
本篇访谈内容结合了 Dev Day 活动后,CNBC 对 COO Brain Lightcap 的采访,以及上周 OpenAI 在领导层变动后的交流内容。本文亦解答了几个问题:公司现在状况如何?目前最大的收入驱动力是什么?当今 AI 最被夸大和最被低估的是什么?OpenAI 目前最大的收入驱动力是什么?这项技术对企业到底意味着什么?
在 2022 年 11 月 OpenAI 推出 ChatGPT 前几周,OpenAI 高管团队花了专门的时间讨论一个问题:他们是否应该发布这款工具?
如果你了解 Sam Altman,就会知道他喜欢高效迅速讨论各种话题,所以我们在一个话题上花了这么多时间,就意味着它很重要。任何人都不能 100% 确定这将是一件正确的事情,或者是一件值得我们花时间去做的事情。
Brain Lightcap 回忆说,当时,OpenAI 的 GPU 资源非常有限,而且定位自己是一家为开发者和企业开发工具的公司,而就在这样的情况下,公司首席执行官 Altman 非常支持「试一试」,这个观点的基础是,基于文本与模型进行交互是非常重要的,具备个性化的要素。
这一决策最终获得了回报。数据显示,ChatGPT 打破了历史纪录,成为增长最快的消费端应用,目前每周活跃用户约为 1 亿,超过 92% 的世界 500 强企业都在使用 ChatGPT。据 PitchBook 报道,今年早些时候,微软向该公司追加了 100 亿美元的投资,使这笔投资成为今年最大一笔针对人工智能赛道的投资。
不过,最近这几周该公司经历的跌宕起伏的发展,似乎让过去那些令人赞叹的里程碑黯然失色。上个月,OpenAI 董事会突然决定将 Sam Altman 赶下台,引发了几乎所有 OpenAI 员工的反对及辞职威胁,包括一封签名的公开信,以及包括微软在内的投资者的震惊。
不到一周,Altman 又回到了公司。上周三,OpenAI 宣布成立新的董事会,其中包括前联席首席执行官 Bret Taylor、Larry Summers 和 Quora CEO Adam D'Angelo。微软在 OpenAI 董事会拥有观察员席位。
本篇访谈内容结合了 Dev Day 活动后,CNBC 对 COO Brain Lightcap 的采访,以及上周在领导层变动后的交流。
问:我们即将迎来 ChatGPT 成立一周年。去年这个时候,正处于 ChatGPT 首次亮相的前几周,当时 DALL-E 还在试用版阶段,那个时候 Stable Diffusion 备受关注,而 ChatGPT 还不存在。那个时候,你们的团队是怎样的?
答:当时我们都认为自己是一家专门为开发者打造工具的公司,所以对当时的 OpenAI 来说,要考虑做一个「普通人也能拿起来用的东西」,是一件有点新奇的事情。
我们曾在 DALL-E 这款产品中,有过类似的感受。大家用过 DALL-E 之后,我们发现很多用户对这款产品感到很兴奋。但我们一直认为,DALL-E 本质具有视觉属性(更容易引发关注),因此它将会成为消费者对这些工具的兴趣水平的高点。因此,当我们在研究 ChatGPT 时,把 DALL-E 作为一个基准来看,来衡量有多少人会使用它,谁会对它感兴趣,ChatGPT 会不会让人们玩了一会儿就觉得这不是一个真正的工具?而更会像是一个玩具?
当时,OpenAI 的团队曾打赌 ChatGPT 的规模会有多大。我当时下的赌注是,在使用的高峰顶点,任何给定的点上都会有一百万并发用户,也曾针对这个目标制定计划,当然,作为财务人员,也对这个预测数据做了很多模型测算,这就是我们当时的情况,但是现在回过头来看,这个估计并不准确。
就商机而言,当时 OpenAI 对 ChatGPT 的预期是什么?
答:当时我们根本无法明确知晓它的所有用途,而这就是这项技术的悖论所在,ChatGPT 的用途过于广泛,而且它作为一种工具,渗入了世界和人们生活的方方面面,而用户却不知道自己居然还需要这样一种工具。
因此,就要提前进行业务分析,并试着思考:「好吧,人们会用 ChatGPT 来做什么?是什么推动了对它的持续付费?」然后,开始尝试赋予它实用性。试着把 ChatGPT 想成:人们可能会用 ChatGPT 来创作,可能会用 ChatGPT 来做这个,或者做那个。在某种程度上,有很多事情,现在回想起来,我们知道人们用它来做什么,但在当时,我们根本无法想象,那个时候也无法去证明为什么 ChatGPT 会如此成功。
这也许是一个有趣的教训,那就是商业分析并不总能说明问题,但能够下注并真正发现某件事情将在哪些方面具有广泛的实用性和价值,以及它将在哪些方面作为一种新事物与人们产生共鸣,这点甚至胜过商业分析的作用。
问:今年 8 月,80% 的世界 500 强企业应用 ChatGPT。现在,截至 11 月,已经达到 92%。至于剩下的 8% 尚未采用该工具的公司,这里有什么趋势吗?
答:从某种意义上来说,8% 的公司主营业务偏向重工业的。......像石油和天然气这样的大型资本密集型行业,或者拥有大量重型机械的行业,这些行业的工作更多是生产产品,而不是信息业务或服务业务。
问:在您眼中,当今人工智能最被夸大和最被低估的方面是什么?
答:我认为人工智能被夸大的方面是,认为人工智能这项技术可以一举带来实质性的业务变革。我们和很多公司都谈过,他们想把他们想做很久的事情和 OpenAI 捆绑,比如他们说「我们想让收入同比增长恢复到 15%」,或者「我们想从这个成本项目中削减 X 万美元的成本」。但几乎从来就没有什么灵丹妙药,你永远不可能用人工智能做一件事就能完全解决这个问题。我认为,这恰恰证明了这个世界真的很大、很乱,而且这些系统仍在不断发展,它们真的还处于起步阶段。
我们确实看到,而且我认为这项技术被低估的地方,是这些系统为最终用户创造的个人授权和赋能水平。我们从用户或客户那里听到的情况是,由于类似 ChaTGPT 这类工具的帮助,人们现在拥有了超能力,而这些人以前是做不到的。
问:谈谈生成式人工智能的业务。反对者提到,消费级应用层出不穷,但是否会过度饱和?这项技术对企业到底意味着什么?
答:目前正处于 AI 真正的早期阶段,必须保持让世界维持极高的实验率和极高的试错率的能力,这一点非常重要。如果你看看过去技术阶段性转变的历史趋势,总会有这样一个非常重要的实验阶段。从零开始掌握正确的技术是非常困难的。我们最终会达到目标,技术的最终状态,我们最终会趋同于这一点——但只有在真正尝试了很多东西,看到哪些有效,哪些无效之后,人们才能在有效的基础上,创造出下一个最好的东西。
我对此的看法是,在这项技术基础上构建的最重要的东西其实是那些尚未被创造出来的东西。因为要真正了解这些工具的能力,以及如何将这些工具与其他方面的技术相结合,从而创造出比各部分叠加之后,更强大的东西,还需要一些使用这些工具的周期。因此,这是意料之中的,我认为这是非常健康的。
问:几年前,人们对 AI 在卡车运输业的应用水平感到惊讶,有观点认为,卡车属于过于传统的行业,而现在,人工智能几乎已成为每个行业的一部分。就您近年来看到的应用趋势而言,是否有类似的贯穿线,是否有一个行业以全新或不同的方式使用人工智能,让您感到特别惊讶?
答:技术行业肯定有很大的吸引力。我们看到的是,ChatGPT 是很好的技术助手,无论是软件工程师、机械工程师、化学家还是生物学家,在学科的另一面都有一个庞大的知识库,对它的掌握程度决定了你的工作效率。
人们在职业生涯中都在努力掌握这门学科,尽可能多地吸收该领域的知识。特别是在某些领域——无论是生物学、化学还是人工智能,这些领域的文献都在不断发展,不断有新的东西被发现,不断有新的研究被完成。因此,我不知道这本身是不是最令人惊讶的事情,但我们看到的最酷的事情之一,就是 ChatGPT 在这方面几乎就像一个小助理,几乎就像一个研究助手。......我们感受到了来自这些行业的吸引力,这是我在 2022 年 11 月时所没有想到的。
问:ChatGPT 企业版已经上线几个月了。我记得你们在不到一年的开发时间里就推出了 ChatGPT,并有 20 多家公司(如 Block 和 Canva)参与了测试。具体来说,使用量是如何增长的?自推出以来,谁是你们最大的客户?
答:压倒性的热情,不过我们仍然是一个小团队,过去两个月的很多重点是确保我们实施和加入的第一批客户看到产品的价值。...我们仍在处理成千上万的候补名单,我们希望能接触到每个人,这将是 2024 年的目标。
问:现在有了 ChatGPT Enterprise,那么 OpenAI 目前最大的收入驱动力是什么?您认为这将如何发展?
答:OpenAI 几乎从不采取以收入为中心的方法来构建和推出产品。我们总是采取以应用(产品)为中心的方法,也就是说,我们非常看重我们所构建的产品,需要在两个领域中满足其中一个条件 1.需要成为真正有用的工具,让开发人员去构建东西;或者 2.它们需要成为真正有用的抽象,让用户在产品中发现更多价值。
例如,如果看一下 GPT,它实际上有点完美地映射,希望它能勾选第二部分的方框:这是一种抽象 ChatGPT 中智能力量的方法,并将其指向非常具体的东西,并给它正确的上下文、正确的工具, 正确的连接,能够真正擅长解决特定的事情?这可能是对你的工作有用的东西,或者可能是对你的生活有用的东西,或者它可能只是一件有趣的事情。
问:多模态的 ChatGPT ,即在同一服务中提供图像生成和其他工具 -- 是 Dev Day 上概述的公司的一大优先事项。请告诉我为什么它如此重要。
答:世界是多模态的。如果想一想我们人类处理世界和接触世界的方式,我们看到的东西、听到的东西、说出来的东西——世界比文字大得多。因此,对我们来说,将文字和代码作为单一的模式、单一的界面,让我们了解这些模型有多么强大以及它们能做什么,总是感觉不完整。
因此,我们开始将视觉功能分层。事实上,计算机能够看到世界上正在发生的事情,并对其进行描述、参与和推理,这可能是我个人在 OpenAI 任职五年来看到的最令人震惊的事情。我至今仍无法真正理解其中的含义。但你仔细想来,就会发现以前不可能实现的事情现在开始变得可能了。
可以想一想一些简单的事情,比如能够帮助视障人士更好地了解他们周围的世界,而且是低延迟、高质量的。举例来说,公司现在可以更好地了解他们的设备,并为消费者创造体验,只需对准摄像头,就能揭开眼前事物工作原理的神秘面纱。在教育领域,我们能够帮助人们更好地理解和分析事物 -- 很多人都是真正的视觉学习者 -- 我们能够看到一些东西,并且能够以一种更适合他们学习风格的方式与图形接触,这是我们已经释放出的一种完全不同的能力。
因此,让我感到兴奋的是,它现在为我们提供了一种使用技术的方式,这种方式更符合人类与世界打交道的方式 -- 并最终使技术更加人性化。
问:我们知道,OpenAI 的 GPT-4 大语言模型可能比 GPT-3.5 更可信,但也更容易受到潜在偏见的影响。您能否向我介绍一下 Dev Day 上宣布的新 Turbo 模型有什么不同(如果有的话),以及您的应对计划?
答:我们会发布 Turbo model card [a transparency tool for AI models],这可能是参考一些技术基准的更好地方。
问:你对未来一年最大的希望是什么?未来版本的 GPT 能够实现哪些当前版本无法实现的功能?
答:我认为,这里的进步曲线是沿着推理能力的质量前进的。如果从根本上说,人类做得好的地方在于,我们可以把很多不同的概念结合在一起,针对我们想做的事情或别人要求我们做的事情,以一种创造性的方式创造出针对该要求的结果。我们每天都在这样做,我们每天都在以艺术的身份这样做,这是我们创造世界的基础。
这就是我们希望看到的技术发展方向——推理能力得到显著增强;可以处理越来越复杂的任务,并找出如何将这些任务分解成它所需要的各个部分,从而能够以高水平的熟练度完成这些任务;然后与所有这些任务相邻,真正安全地完成这些任务,我们从研究的角度强调要正确处理技术的安全方面。随着系统的功能越来越强大,我们需要同时提高安全标准,因为随着时间的推移,这些系统将变得越来越自主。如果不能同时做好安全方面的工作,这一点就行不通。
问:在过去的一年里,公司有哪一天让你印象深刻?
答:推出 GPT-4 的那天,人们并没有意识到,在发布 GPT-4 之前,我们已经研究了多久。因此,OpenAI 内部对它充满了兴奋,我们知道这将是这些模型能力的真正转变,也是人们认为真正高质量语言模型的真正转变。一旦有了这样的模型,你就想与全世界分享。我们团队从世界对这些东西的反应中获得了很多能量,当我们的客户、开发人员和用户参与其中时,我们看到了他们的兴奋。
在之前的七八个月里,我们知道那一刻即将来临,所以我们一直都很兴奋...
那个时候,还没有像 Dev Day 那样举办大型发布活动。就在我们发布之后,有一个时刻,我想我们是在咖啡厅的全员空间里,每个人都环顾四周,有种兴奋、解脱和疲惫的混合,但每个人都在微笑。这是一件非常特别的事情......这样的时刻很珍贵。
问:回家后,你个人做了什么来庆祝?
答:我用工作到了深夜来庆祝
问:在 OpenAI 不到 10 年的时间里,大家见证了它从一家非营利公司发展成为一家「研究和模型部署 」公司。人们问这意味着什么,你们的结构是怎样的,以及微软拥有多少股份。您能对这一历程做一些说明吗?
答:从高层来说,我们希望公司的核心结构能够保留最初的 OpenAI(OpenAI 非营利组织)。当我们组建公司时,问题是如何做到这一点。这也是我刚加入 OpenAI 时所做的工作:弄清楚'是否有办法将 OpenAI 的使命 -- 以及作为使命体现的非营利组织,置于我们新结构的中心?
因此,我认为这是了解 OpenAI 的第一件事:从这个意义上讲,它不是一家普通的公司。从字面上、结构上以及精神上来说,它都是非营利组织使命的延伸。它的主要职责是执行非营利组织的使命,即构建安全、广泛造福人类的人工通用智能。因此,也许这听起来很疯狂,当然也有更简单的结构和技术方法来建立公司,而且法律费用会更低、更少,但对我们来说,做好这一点真的很重要。所以我不知道我们是否做到了,我想,时间会证明一切。有一点很好,那就是这种结构具有很强的适应性。因此,随着时间的推移,我们会学到更多,也必须适应这个世界,我们可以确保这个结构是为成功而设置的,但我认为它的核心部分是,我们希望保留 OpenAI 的核心使命作为公司存在的理由。
问:聊聊微软的所有权?
答:我不会对任何结构方面的具体细节发表评论,但这是一个旨在与世界合作的结构,而微软恰好是一个很好的合作伙伴。但我们一直在思考,如何让这种结构能够延伸到世界,并与世界进行互动,从而与非营利组织的使命相契合。因此,我认为这也是利润上限模式的部分基础。
问:OpenAI 成立之初,你就与 Sam Altman 共事。你们在工作中的主要区别是什么?你们相互弥补了对方的哪些优缺点?
答:萨姆的行动速度快得令人难以置信。我认为我和他有一个共同点,那就是我们喜欢在所有事情上保持高速。
我认为我们彼此平衡的地方在于,萨姆绝对是面向未来的,他是个活在未来的人。而我认为,他确实应该活在未来,在这方面 Sam 相当出色。我的工作是确保我们构建公司的方式、我们开展业务的方式、我们与客户和合作伙伴建立合作模式的方式,不仅反映出我们认为世界将在五年多的基础上走向何方,而且还能实现我们今天想要实现的目标。
我们面临的挑战是技术日新月异。因此,我们非常重视向世界宣传如何使用技术、我们所做的工作类型(从安全到能力)、我们对产品的思考方式以及我们产品不断变化的面貌。当你脚下的土地在快速变化时,要想在高速运转的情况下做好这些工作,就必须做好协调工作。因此,我希望我的附加值就在这里,就是专注于做好这些工作 -- 建立一支优秀的团队,帮助我们做好这些工作。如果能做到这一点,并且脚踏实地,最终会走上正确的道路。
问:OpenAI 在短短一周内发生了巨大变化。现在 Sam 又回到了公司,新的董事会结构也已经公布,你对这将如何影响日常工作有什么看法?预计未来几个月还会发生其他结构变化吗?
答:日常工作不会有任何变化,OpenAI 的使命是不变的,我们的重点仍然是为客户、用户和合作伙伴开展出色的研究和建设,并为他们提供服务。我们已经与大家分享过,我们现在已经有了一个初步的董事会,并希望增加更多的董事会成员。
问:公司现在的总体气氛如何?
答:过去几周,公司以一种难以形容的方式凝聚在一起。我对团队充满感激,对我客户和合作伙伴深表感谢,他们自始至终都给予了我们极大支持。这种支持让我们充满活力,继续为实现我们的使命而更加努力地工作。就我个人而言,我非常专注。
(Lightcap 和 OpenAI 拒绝就 Altman 下台和重新任命的具体情况发表进一步评论 )
参考资料:
1.https://www.cnbc.com/2023/12/04/openai-coo-brad-lightcap-interview-with-cnbc.html
编辑:web3528btc 来源:加密钱包代币