OpenAI的组织架构问题如何拖累ChatGPT

作者:斯蒂芬妮・帕拉佐洛、斯里・穆皮迪、阿米尔・埃弗拉蒂分
过去一年里,部分 OpenAI 员工注意到,用户对 ChatGPT 功能升级的反应出现了一个值得警惕的变化。
一名员工透露 ,前些年,每当 OpenAI 对驱动这款聊天机器人的人工智能技术进行重大升级后,用户活跃度都会大幅攀升 ,因为大家能轻松地用它获取实用信息 。
但多名员工表示,尽管今年 ChatGPT 的用户总量有所增长,但底层 AI 模型在智能水平上的提升 —— 以及由此获得的深度研究 、复杂运算能力 —— 似乎并未引起大多数用户的关注。
核心要点
这一趋势让员工们百思不解。公司研究团队曾耗时数月研发推理模型 ,相比 ChatGPT 前代模型,该模型能投入更多算力处理数学、科学等领域的复杂问题 。今年夏天,OpenAI 还高调宣称 ,其 AI 在 2025 年国际数学奥林匹克竞赛中斩获金牌级成绩;秋季,该 AI 又在 2025 年国际大学生程序设计竞赛中表现优异。
但一些 OpenAI 员工表示,用户向 ChatGPT 提出的大部分问题 ,其实根本用不上这些升级功能。
“OpenAI 一味聚焦科学、数学基准测试 、前沿数学研究、编程竞赛…… 这些方向似乎与 ChatGPT 普通用户的需求脱节 。” 人工智能性能测评初创公司 LMArena 的 AI 能力负责人彼得・戈斯特夫如此评价。他指出,大多数时候,ChatGPT 用户只是 “询问一些非常简单的问题,比如电影评分 ,这类需求根本不需要模型花半个小时去推演 ”。
OpenAI 今年 9 月发布的 ChatGPT 用户查询数据,似乎也印证了戈斯特夫的观点 。
技术研发与产品需求的脱节,加之其他一系列问题 ,给谷歌等竞争对手创造了赶超 ChatGPT 的机会。为此,OpenAI 首席执行官萨姆・奥尔特曼在本月初发出 “红色警报”,要求公司重新聚焦核心任务 ,通过升级 ChatGPT 来吸引更广泛的用户群体。
用户对 ChatGPT 新模型的态度转变,折射出一个关键矛盾:作为技术核心的 AI 研究部门,其研发目标并非总能契合 ChatGPT 的产品需求 —— 要知道 ,这款聊天机器人可是公司的主要营收来源 。与此同时,随着谷歌等企业不断将 AI 功能整合到搜索引擎、移动设备 、办公软件等各类消费级产品中,OpenAI 对 ChatGPT 的营收依赖正逐渐成为其短板。
曾几何时 ,OpenAI 与谷歌的高管都认为,ChatGPT 有望取代谷歌搜索这一主流平台。但如今,“ChatGPT 颠覆谷歌搜索” 的论调已然降温。谷歌搜索已在结果页顶部增设了 AI 生成答案功能,该公司在 10 月披露 ,这一功能正推动搜索查询量和营收实现 “显著增长 ”,因为 “用户逐渐发现,谷歌能解答更多类型的问题” 。
OpenAI 之所以重启 ChatGPT 升级计划 ,背后是用户增长目标恐难达成的压力。今年年初,ChatGPT 的周活跃用户数为 3.5 亿,当时公司设定的年度目标是突破 10 亿。但截至本月初 ,其周活跃用户数尚不足 9 亿,年度目标的实现难度不小 。
不过,OpenAI 在付费转化方面成绩亮眼:越来越多的个人用户和企业选择订阅 ChatGPT ,以解锁更多功能并获得无限制使用权限。目前,公司年化营收已突破 190 亿美元,且绝大部分来自订阅服务 —— 这一数字较今年 1 月的 60 亿美元大幅增长。这意味着 ,OpenAI 有望在年底达成 8 月设定的 200 亿美元年化营收目标 。同时,公司也将超额完成 2025 年 130 亿美元的营收目标(去年营收约为 40 亿美元)。此外,OpenAI 正计划以 7500 亿美元的估值进行新一轮融资,较两个月前股权出售时的估值高出 50%。
以多数标准衡量 ,这些数据都相当可观,令人艳羡 。但员工和投资者指出,若想实现 2030 年 2000 亿美元的营收目标 ,OpenAI 需要推动周活跃用户转变为日活跃用户。唯有如此,公司才能通过在 ChatGPT 中投放广告,或从用户通过该平 *** 成的商品交易中抽取佣金 ,来开辟更多营收渠道。(OpenAI 发言人在一份声明中表示,ChatGPT 占据了全球智能助手市场约 70% 的份额,同时是今年苹果应用商店下载量更高的免费应用 ,且在不到三年的时间里斩获了 10% 的搜索市场份额 。)

文本形态的局限性
要实现这一目标,OpenAI 必须解决组织架构和产品设计层面的多重难题。多名员工透露,拥有超千名研究人员的 OpenAI 研究部门 ,在公司内部基本处于相对独立的状态。今年以来,该部门的研发重心一直放在推理模型上,而非针对 ChatGPT 进行专项优化。
但一位参与过推理模型研发的人员表示,这类模型对 ChatGPT 的实际助益十分有限 ,毕竟用户普遍追求快速响应 。通常情况下,推理模型需要花费数秒乃至数分钟才能生成答案 —— 对于习惯了谷歌搜索迅捷体验的用户而言,这样的等待时间漫长得像一个世纪。OpenAI 则称 ,推理模型最适合完成复杂的多步骤任务、审阅海量代码,或是从企业海量文档中精准定位特定信息。
比推理模型问题更严峻的是:即使用 ChatGPT 搭载响应速度更快的非推理模型,消费者似乎也并不清楚这款聊天机器人的功能边界 。多名员工指出 ,这直接限制了用户的使用时长。
具体而言,ChatGPT 纯文本的交互设计,让用户很难发现它的其他功能。例如 ,它其实能分析机械故障或电脑报错的图片,并给出维修建议 。ChatGPT 产品负责人尼克・特利表示,当前的界面体验有点类似 20 世纪 80 年代微软推出的纯文本电脑操作系统 MS-DOS。他补充道 ,个人电脑革命的真正爆发,是在微软推出视觉效果更出色、操作更直观的 Windows 系统之后。
OpenAI 其他高管也认同这一观点,称 ChatGPT 的界面必须做出改变,才能真正实现大众化普及 。本周 ,OpenAI 应用部门负责人菲吉・西莫在一篇博客中写道,ChatGPT 正 “从以文本对话为主的形态,向全生成式用户界面演进 —— 根据用户的需求 ,自动匹配并呈现相应的功能组件”。本周二,OpenAI 面向 ChatGPT 用户推出了全新的图像生成模型,并表示将在聊天回复中融入更多图像内容。
“产品并非最终目标 ”
不过 ,数月前从生鲜配送平台 Instacart 跳槽至 OpenAI 、负责 ChatGPT 及其他应用产品的西莫,似乎很清楚自己管辖业务面临的局限性 。她近期在博客中写道,OpenAI 的核心定位仍是一家研究驱动型公司 ,“产品本身并非最终目标”。
反观那些主打消费级市场的 OpenAI 竞争对手,它们的研究方向与产品开发之间似乎并未出现这种脱节。以人工智能公司 Anthropic 为例,其研究重心基本围绕面向企业客户的应用程序接口(API)展开。目前 ,Anthropic 的模型越智能 —— 尤其是在代码生成领域 —— 其 API 业务的销售额就越高 。OpenAI 的模型升级同样能带动 API 销售,但这部分收入在公司当前及预期营收中,仅占很小的比例。
多名员工称,今年大部分时间里 ,奥尔特曼管理 OpenAI 的姿态,仿佛公司已经垄断了聊天机器人市场。他启动了不计其数的其他产品项目,包括视频生成应用 Sora、AI 音乐生成工具、网页浏览器 、专业 AI 智能体、消费级硬件设备、机器人技术等 。
多名 OpenAI 研究人员表示 ,这些项目分流了大量资源,导致提升 ChatGPT 大众吸引力的工作被搁置。
据一位近期与 OpenAI 领导层有过交流的人士透露,公司高管们日益意识到 ChatGPT 正面临严峻挑战 ,这让许多人深感不安。在 “红色警报” 声明中,奥尔特曼表示,计划抽调部分员工重新投入 ChatGPT 的研发工作 。
OpenAI 发言人回应称:“产品与研究深度关联、并非对立。研究突破塑造产品形态 ,产品反馈反过来指导研究方向。这是一套统一的战略,旨在研发并安全部署能力持续提升的模型,而非研究与产品的二元对立 。 ”
理性探索的边界
过去一年 ,OpenAI 的传统训练 *** 在优化大语言模型方面逐渐遭遇瓶颈,研究部门与 ChatGPT 产品团队的分歧也由此浮现。无奈之下,公司将研发精力转向推理模型,希望借此最终实现通用人工智能(AGI)—— 即达到或超越人类能力的人工智能。
起初 ,研究人员认为推理模型同样能优化 ChatGPT 的性能 。但今年年初,当 OpenAI 将其更先进的推理模型适配为 ChatGPT 可用版本时,模型的实际表现反而变差了。事实证明 ,为了适配聊天场景而对模型进行的改造,无意间降低了它的智能水平。
尽管如此,OpenAI 还是找到了将推理模型融入 ChatGPT 的办法:目前 ,该模型为 ChatGPT 的 “思考模式” 和今年 2 月推出的深度研究智能体(可自动生成研究报告)提供技术支持,同时也是 OpenAI 代码辅助工具 Codex 的核心驱动力。但多名员工表示,在 ChatGPT 近 9 亿的周活跃用户中 ,经常使用这些功能的人寥寥无几 。
此外,部分 OpenAI 研究人员也坦言,推理模型能否通向通用人工智能 ,目前尚无定论。
OpenAI 近期对 ChatGPT 的一项调整,似乎暗示推理模型正成为这款聊天机器人的 “负担”。本月初,公司悄然取消了免费版和更低档付费订阅版的一项功能 —— 此前,这两个版本会自动将用户的问题转交给推理模型处理 。
在将升级后的模型整合到 ChatGPT 的过程中 ,OpenAI 还面临其他障碍:即便是传统的非推理 AI 模型,也可能与 ChatGPT 的部分功能产生冲突。例如,为实现个性化体验 ,ChatGPT 会根据对用户的了解提供差异化回答,但这一功能就可能与新模型产生兼容问题。
一名现任员工透露,在今年 8 月推出旗舰大语言模型 GPT-5 前夕 ,研究人员发现,当该模型接入 ChatGPT 后,在编程等特定任务上的性能出现了下滑 。原因在于 ,当用户向 ChatGPT 发送请求时,聊天机器人会调取用户职业等个人信息,以此生成个性化回答。
但该员工表示 ,这些个人信息有时会干扰模型对用户问题的理解,进而导致回答出错。尽管 OpenAI 在 GPT-5 发布前修复了这一问题,但员工们认为,新模型与 ChatGPT 现有功能之间的冲突 ,未来还会持续出现 。
谷歌的强势反击
OpenAI 研究与产品的脱节,还体现在其他方面。两名员工透露,今年早些时候 ,公司曾将图像生成模型的研发列为低优先级项目 —— 要知道,今年 3 月,正是图像生成功能一度推动 ChatGPT 的用户活跃度和新增用户数大幅增长。
目前尚不清楚 OpenAI 当初为何做出这一决策 。但据其中一名员工表示 ,今年 8 月,谷歌推出自研图像生成 AI “纳米香蕉 ” 并广受消费者好评后,OpenAI 领导层才仓促决定升级自家的图像技术。这一转变还引发了一场内部分歧:奥尔特曼认为图像生成功能对 ChatGPT 的增长至关重要 ,而公司研究主管马克・陈则希望优先推进其他项目。
在本月初的 “红色警报” 声明中,奥尔特曼明确将图像生成列为 ChatGPT 升级的核心任务。本周,OpenAI 正式为这款聊天机器人推出了全新的图像生成模型 。
谷歌的反击让 OpenAI 面临严峻挑战:长期以来 ,谷歌凭借搜索引擎 、Chrome 浏览器、Gmail 等办公应用,在 AI 技术触达用户方面占据天然优势。近几周,谷歌的 AI 模型能力持续提升,在图像生成、代码编写等诸多任务上 ,已与 ChatGPT 不相上下,这也让谷歌的聊天机器人及其他 AI 产品更具吸引力。
据一位与 OpenAI 领导层有过交流的人士透露,公司高管担忧 ,普通用户可能根本看不出 ChatGPT 与谷歌 Gemini 的区别 。更关键的是,与脸书 、照片墙这类社交应用不同 —— 这类平台的用户越多,产品体验就越好 ,从而形成 *** 效应 —— 聊天机器人领域并不存在这样的优势。
OpenAI 还面临另一大劣势:财务压力。为了租赁更多服务器来训练和运行包括 ChatGPT 在内的 AI 模型,公司每年要消耗数十亿美元的现金 。尽管 OpenAI 正着力建设自研数据中心和服务器芯片,以期长期降低成本 ,但谷歌早在十年前就已开始研发 AI 专用服务器,因此如今能实现更高的运营效率。





发表评论