深度 · 小互解读

OpenAI 总裁说:最好的产品,是没有产品

Brockman 确认 OpenAI 在研多款硬件;Agent 用户仅约 2000 万,ChatGPT 用户却已逼近 10 亿。
速览
  • OpenAI 总裁 Greg Brockman 在旧金山 Big Technology AI 峰会接受专访:ChatGPT 即将突破 10 亿用户,公司正以万亿美元估值推进上市,并完成了 1220 亿美元的史上最大风险投资轮。
  • 他的核心论断是「界面终将消融」:未来用户不需要 app 也不需要产品,而是和一个持续存在的 AGI 实体直接交谈,给它目标,让它去行动。
  • Codex 已从写代码工具变成通用 Agent 框架,公关、运营等非技术团队大量在用,内部渗透率已接近 Slack。
  • 他断言 Scaling law 至今有效,每次「模型撞墙」查下去都是工程 bug;OpenAI 的算力策略是「全买」,并已自研芯片多年。
  • OpenAI 正研发多款硬件设备,并在开发端到端双向语音模型,目标是取代「轮流发言」,实现像真人一样可随时打断的对话。
立场提示:这是厂商高管在自家峰会上的访谈,下列用户规模、估值、能力描述多为 OpenAI 自家口径或第三方预测(如 ChatGPT「10 亿用户」为第三方数据预测)。本文按访谈原话呈现观点与案例,不代为背书。
▶ 原片 · Big Technology AI 峰会 Brockman 压轴段(已定位到 3:00:25 他登场处,约 47 分钟)
1背景

11 年后,OpenAI 现在有多大

OpenAI 总裁兼联合创始人 Greg Brockman 近日在旧金山 Big Technology AI 峰会(Commonwealth Club)接受 Alex Kantrowitz 压轴专访,这是两人第四次对谈,话题覆盖 Agent 时代、界面形态、算力竞赛与产品路线图。

2015 年,他和 Elon Musk、Sam Altman 创立 OpenAI 去追逐 AGI。11 年后的今天,这家公司很可能在未来一年以万亿美元估值上市。这场访谈之所以分量重,是因为说话的人正站在这个体量的顶端,谈的是接下来要把产品做成什么样。

为何值得看:这是 OpenAI 总裁首次公开确认正在研发多款硬件设备;Codex Agent 在公司内部已达 Slack 级渗透率;上下文窗口从 2022 年的 2K token 扩到今天的 500 万到 1200 万 token;每周有 2.3 亿人用 ChatGPT 查询健康问题。

≈10 亿
ChatGPT 预计用户规模(第三方数据预测)
1220 亿
最新融资轮规模(美元),史上最大风险投资轮
万亿级
预计上市估值(美元),可能就在未来一年
11 年
从 2015 年创立追逐 AGI 到今天
2核心论断

他说:最好的产品,是没有产品

主持人复述一种说法:OpenAI 正在把 Codex、浏览器、ChatGPT 整合成一个「super app」,任何事都从一个 prompt 开始,再由技术去调用你的浏览器或电脑把事办成。Brockman 认同这个视角,但他要把镜头拉得更远。

他说真正想造的是 AGI。2022 年发布时,ChatGPT 没有记忆、没接任何工具、没有上下文,这种对话式智能只是人们把活干完所需的一小部分。OpenAI 要走向的是一个真正替你着想的 AI:你给它目标,它持续在想「今天能为你做什么」,既解决超难问题,也处理琐事,一觉醒来收件箱已整理好,也能帮你把医疗方案弄清楚、来回沟通。

Hero · 界面消融

他的结论是:你几乎不想要「界面」、不想要「产品」。你想要的,就是像人和人之间那样,能跟一个持续存在的实体说话,让它去帮你达成目标。长期方向是简化和统一,让整个系统不用那么多点按钮、拨开关、切模式,界面会一点点「消融」。

APP AGI 持续存在的实体 app · 按钮 · 模式(淡出)
界面消融:左侧碎片化的 app/按钮逐渐淡出,人不再去适应文件、文件夹这些只关于机器的细节,而是一条线直连中央的 AGI 实体,只需说出目标。

他特别点了一句机器与人的关系:AI 的美妙之处,是把机器拉近到人这边,而不是逼人去适应文件、文件夹这些只关于机器怎么运作、并不自然的细节。

3现在进行时

不信?Codex 在公司内部已经这样了

「界面消融」听起来像远景,但 Brockman 说它已经是现在进行时。Codex 名字里带 code,其实跟代码关系不大,本质是一个通用的、能用工具的执行框架,也就是一个 Agent。你可以把它接到 Slack、Gmail、日历上,OpenAI 内部很多非技术员工已经在用。

真实案例

公关团队一位同事在筹办活动,让 Codex 去逐一询问所有参会者的饮食偏好、自动排好整张座位表,把这些杂活全干了,她只需专注在真正想投入的部分。

渗透程度

Codex 一开始聚焦软件工程,但非软件类用量爆发式增长,在 OpenAI 内部已基本达到和 Slack 一样的渗透率,全公司靠 Slack 运转、几乎不用邮件,现在 Codex 也开始给人这种感觉。

Slack全公司枢纽
Codex已接近同级

主持人把这套形容成 OpenAI 成了一个「操作系统」,但 Brockman 不接这个框。他说操作系统几乎是另一个时代的概念、是技术栈里的一层,而他想的是「通往 AGI 的理想界面是什么」,可以叫某种「个人 AGI」。那个 Agent 会有自己的电脑、自己的访问权,像一个理想的同事,过来在你电脑上敲东西,有一些被你委托的、对你系统的访问权,这和你跟一位助理建立信任边界一起工作并无本质不同。

4为什么是现在

旧版「AI 助手」为什么根本不好使

OpenAI 第一次在 ChatGPT 里尝试工具调用,是 2023 年三四月发布的插件,Brockman 的评价是「完全不好使」。但他说原因不是想法错了,而是基础条件没到,模型还没准备好。换句话说,时机成熟不是因为 AI 突然变聪明,是底层条件变了。

2023 · 插件时代
3 个
  • 一次只能给模型暴露 3 个连接器,再多它就开始遗忘
  • 上下文只有 2K 顶多 4K token,基本没有记忆
  • 一用工具就忘事,像六七十年代只有很小内存块的早期计算机
今天 · Agent 时代
数百个
  • 能让模型同时用上几百个工具,接到整个文件系统
  • 上下文到 500 万至 1200 万 token,几乎把整个互联网放到指尖
  • 能控制整台浏览器和电脑,已在解决未解的数学和物理难题
上下文窗口,用大白话讲

上下文窗口,就是 AI 每次能「记住」并同时处理的文字量,相当于工作桌面的大小:桌面越大,能同时摊开的资料越多,多任务就越顺。2022 年的桌面是一张 A4 纸,今天是整个房间。

他还对比了一个更早的失败:OpenAI 曾做过让你在 ChatGPT 里叫 Uber 的动作,很多公司都试过让你在聊天里采取行动,但从没真正火起来。区别在于现在聊天机器人能直接接管你的浏览器或电脑,不用再担心某个插件好不好使,它通过接管你的机器去把事办成。

5产品设计的真正分水岭

把多少信任交给 AI?这才是真正的产品设计

Brockman 反复强调一个词:信任。Agent 时代的核心差异点不是技术,而是信任边界,AI 到底被允许有多大的自主权。他说信任是要「挣」来的,不是能直接授予的,办法是给操作者大量工具、控制权、监督和监管,这是关键的产品特性。他用一封邮件举了三档自主度,你可以自己拨动看看。

▸ 点击切换信任档位,看 AI 在同一封邮件上的不同行为

「我能发出去吗?」

AI 用 Gmail 连接器搜出收件箱里相关的人、起草好邮件,然后停下来征求你的许可。最稳妥:每一步行动前都问你一次,你保留全部最终控制权。

「我草拟好了,你自己发。」

连接器在配置上就不允许它发送,于是它只负责到草稿为止,发送这一步交还给你。适用于权限被产品层面卡死、不依赖临场判断的场景。

「我草拟了,而且已经发出去了。」

当你跟系统建立了足够信任,它直接把整件事办完再告诉你。自主权最高,前提是这份信任已经被它在过往的表现里挣到。

同一个 AI、同一封邮件,因为信任档位不同,产品形态就完全不一样。Brockman 说这种「给操作者足够的监督和监管」正是 Agent 产品的核心差异点,谁能把信任边界设计好,谁的 Agent 才真正可用。

6底层科学

80 年没见过天花板:Scaling law 是什么

几年前流行一种说法:大语言模型快撞墙了。Brockman 说那是错的。他的答案分两部分,第一部分是基础科学:Scaling law 持续有效,这是他所知最神秘也最重要的经验观察之一。每次出现「没按预期 scale」,查下去都是自己有 bug、数学或实现不对,而不是真的触到天花板。

Scaling law,用大白话讲

给神经网络更多算力、更多数据、更好架构,它就会更聪明。就像工厂扩产:生产线越多、机器越先进,产出就越多,至今没见过「再投入也没用」的天花板。这个规律已经被观察了大约 80 年。

他说自己做过研究:神经网络在 1940 年代就被设计出来,当时还没有计算机,它是作为大脑处理信息的模型被提出的;第一个硬件实现是 1959 年的感知机。这个领域的里程碑成果遵循一条极其平滑、确定的路径,就是更多算力被投入。

1940s
神经网络理论提出
在计算机出现之前,作为大脑如何处理信息的模型被设计出来。
1959
感知机:第一个硬件实现
Scaling law 的实证起点,从这里算起至今约 67 年。
七八十年里
历代「必撞墙」预言
一直有人说它永远不会成、scale 不起来、就要到顶了。
至今
实际:墙还看不到
每加一份算力,能力就跟着跃升;所谓的墙一次次被预言,一次次落空。

所以基本面是允许的,难点在工程。要造这些巨型超级计算机很贵很难,得自研网络协议,还得有人吃透技术栈每一层,因为神经网络里没有抽象层,任何一个小部分出错都会连锁反应、最后才在别处显现。把对的团队凑齐、把使命摆在面前埋头苦干,那个结果是可达成的。

7算力逻辑

算力「全买」:背后的逻辑是什么

主持人回忆几个月前问 Brockman 该买多少算力,他答「全买」;对方说「不,认真的」,他还是说「全买」。这听起来像豪赌,但他说这是基本面判断。第一个支点是:算力是真正的稀缺资源,世界根本不会有足够算力满足所有需求,我们正走向一个算力驱动的经济。

他给的最直观证据,是用户规模之间那道巨大的空白。

ChatGPT≈10 亿
Agent 活跃用户≈2000 万

现在用 Agent 的人大概只有 1000 万到 2000 万,还没到全球级;ChatGPT 大概 10 亿用户,但 Agent 能力还没带到那个量级,使用深度相比要去的地方也很小。这中间约 50 倍的差距,就是尚未触达的市场,说明 Agent 大规模普及还在最早期。

Hero · Jevons 悖论

第二个支点是反直觉的:华尔街日报报道 OpenAI 即将推出的模型可能大幅降价,但 Brockman 说降价不会压缩需求,反而像 Jevons 悖论一样让需求不断涌出。前沿智能永远是最贵的,但一年后今天这个水平会显得相当平常、唾手可得,同时冒出更好的新东西让你不想再用旧的。

Jevons 悖论,用大白话讲

一种资源的使用效率提高之后,需求不会减少,反而会暴增,因为成本降低让更多人、更多场景用得起。电费降了,人们反而买更多电器;石油开采效率提高后,全球石油消耗反而上升。AI 降价也是同一个逻辑。

AI 降价
更多人用得起
使用量暴增
算力更稀缺
继续大规模投入
能力提升,价格再降

↻ 飞轮转起来,所以越降价越要「全买」

点开看:H100 价格倒挂与自研芯片

回应 Satya Nadella「模型正在商品化」的说法时,Brockman 反驳:技术栈里没有哪一层会被剔除,这些层是相乘叠加的。最底层的算力,从大家愿意为 H100 出的价钱就能看出价值,Hopper 是上一代芯片,正常情况下没人买,现在反而市场价相对涨了、出现倒挂,因为人人都面对雪崩般的需求。

他还说 OpenAI 的自研芯片项目已投入好几年、进展令人兴奋,很快有更多消息要宣布,能做到供应链完整垂直整合很独特。同时他观察到客户侧的转变:过去大家想「赶紧引进 AI 别被落下」,现在开始问「这玩意儿真能带来 ROI 吗」,于是当天 OpenAI 就发布了开销控制功能。

8最私人的答案

最后说的是医疗:这是他最私人的答案

访谈里 Brockman 多次提到健康,并以此收尾。他说把 AI 用到医学,是他构建 OpenAI 一切的个人动力。这不是愿景,是正在亲眼发生的事。

他的朋友、GitLab 的 CEO Sid Sijbrandij 得了癌症,做完所有能做的诊断检测后,把数据喂进 ChatGPT,还有几个人帮他专门搭了个应用,最终把癌症压制到一定程度。澳大利亚还有一条叫 Rosie 的狗,主人给得了癌症的狗做活检、把突变信息跑了一遍 AlphaFold,在聊天机器人帮助下设计出一种 mRNA 疫苗注射进去,最后肿瘤缩小,那狗又能跳过桌子。

Brockman 说这绝对会成为标配而非个例。他指出过去病人没被赋能、被迫自己当医生:你是做决定、担责任的人,医生犯个错,付出代价的是你的余生,这是非常不同的激励机制。这件事对他也很私人,他太太有好几种健康状况,他说要是没有 ChatGPT,他都不知道现在怎么应付得了她的很多状况。

2.3 亿
每周用 ChatGPT 查询健康问题的人数
20 年
一例神秘病症患者的未确诊时间,最终借助 O3 确诊

他举的论据里,有当天 OpenAI 宣布的一项进展:同行评审文献里,有医生用 O3(OpenAI 最早的推理模型之一)给多年得不到医生答案的人找到诊断,其中一例是某人花了 20 年都查不出的神秘病症最终确诊。考虑到医疗占经济极大一块、医生护士过劳是真实危机,他说如果 AI 能帮人在健康问题出现前就预防,就能减轻大量负担。

要是没有 ChatGPT,我都不知道现在怎么应付得了我太太的很多状况。个性化医疗此刻就在亲眼发生,不是理论。 Greg Brockman · Big Technology AI 峰会
来源:Big Technology AI 峰会(Commonwealth Club),Alex Kantrowitz 对 OpenAI 总裁兼联合创始人 Greg Brockman 的专访。文中用户规模、估值、上下文窗口、渗透率等数据为 OpenAI 自家口径或第三方预测,案例与观点按访谈原话整理,未独立核验。