Forum: >>> Magnum BBS <<<

=?utf-8?Q?[WSJ]=20#=E4=BA=BA=E5=B7=A5=E6=99=BA=E8=83=BD=20=E4=B8=BA=E4=

From Mobot@21:1/5 to All on Fri Jan 31 16:54:42 2025

XPost: alt.chinese.text

为什么“蒸馏 ”成了 AI 公司最害怕的�

DeepSeek 在蒸馏方面的成功引发了人们对科技巨头和初创公司斥资数�亿美元开发最先进人工智能的商业模式的新质疑。照片：Lam Yik/Bloomberg News

作者：Miles Kruppa 和 Deepa Seetharaman

翻译：ChatGPT o1

时长：约 5 - 7 分钟阅读

大型科技公司在人工智能领域投入了数�亿美元，一直基于“越大越好”的理念。然而，DeepSeek 的突破表明，更小的模型也可以同样出色。

这家中国公司的崛起使其跻身顶尖 AI 制造商行列，也在硅谷掀起了激烈讨论。引发争议的原因是 DeepSeek 所使用的一��为“蒸馏 (distillation)”的技术：新的系统通过向已有系统提出数�万条问�
��并分析其答案，来学习已有系统的能力。

“这有点像你只花了几个小时采访爱因斯坦，然后你就几乎具备了他在物理学方面的所有知识，”数�管理公司 Databricks 的首席执行官 Ali Ghodsi 如此形容。

OpenAI 和 Anthropic 等公司开发的领先 AI 模型，基本上是从海量的原始数�中自我学习，其过程往往需要数月时间，以及数�万甚至更多的资金投入。而“蒸馏”则可以在几周甚至几天内，利用已�
�模型的结果打造一个几乎同等水平的模型，成本要低得多。

OpenAI 于周三表示，已注意到 DeepSeek 可能使用了驱动 ChatGPT 的 AI 模型来进行蒸馏，以构建其系统。OpenAI 的�务条款禁止使用其 AI 来开发竞争性产品。

DeepSeek 没有回�记者的邮件置评请求。

其实，“蒸馏”并非新概念，但 DeepSeek 的成功让那些在开发最先进 AI 上投入数�亿资金的科技巨头和初创公司面临新的质疑，包括谷歌、OpenAI、Anthropic 以及埃隆·马斯克的 xAI 等。就在上周，
OpenAI 宣布与软银 (SoftBank) 等合作伙伴达成战略合作，计划在未来五年投入 5000 亿美元用于 AI 基础设施建设。

如果这些巨额投资并�能为公司带来无可撼动的竞争优势，�而沦为低成本竞争对手的“跳板”，那么这笔花销可能就很难得到合理化。在 DeepSeek 的影�下，硅谷的高管和投资人都在�新审视�
�己的商业模式，并思考在这一行业中领先是否�然有利可图。

“如果领先者花费的成本是紧随者的八�，那么走在最�沿是否还有经济价值？”身为硅谷资深科技高管和风投人的 Mike Volpi（Hanabi Capital 的普通合伙人）如此发问。

OpenAI 的首席执行官 Sam Altman 在 X（原推特）上称赞 DeepSeek 最新发布的模型“在性能与价格方面都令人�象深刻”，并表示“我们也将继续推进我们的研究路线图”。Anthropic 首席执行官 Dario
Amodei 则在个人�客中写道，DeepSeek 的旗舰模型“并非独一无二的突破，也�会从根本上改变高端 AI 系统的成本结构，只是预期中在成本下�曲线上的一个节点”。

科技行业高管预计，很快会有更多通过蒸馏打造的高质量 AI 应用问世。AI 公司 Hugging Face 的研究人员上周就开始尝试构建与 DeepSeek 类似的模型。“蒸馏过程是最容易被�制的，”该公司高级研�
�科学家 Lewis Tunstall 如是说。

在硅谷最常用的一些排�中，OpenAI 和谷歌的 AI 模型依旧领先于 DeepSeek。大型科技公司一般会在最�沿的研究和最先进的系统上保持优势，因为他们做了更多原创性的研究。但对许多消费者和企�
��来说，只要技术“�微差一点但便宜很多”，他们就会非常乐意选择。

美国�总统特朗普政府的 AI 专员 David Sacks 在本周二接受福克斯新闻采访时表示，他预计美国公司将会设置更多障�，阻止他人使用自己的模型进行蒸馏。

DeepSeek 过去就曾表示，它曾利用 Meta 和阿里巴巴发布的开源 AI 进行蒸馏，还曾从自己的一个模型蒸馏出另一个模型。一般来说，开源 AI 开发者在被标明出处的情况下会允许模型被蒸馏。DeepSeek �
��身的模型也是开源的。

本月，加州大学伯克利分校 (UC Berkeley) 的研究实验室 NovaSky 发布了一项新技术，�称可与 OpenAI 最近发布的一款模型相媲美，而其研发成本只有 450 美元——它的做法是将阿里巴巴的一款开源模�
�进行蒸馏。伯克利的研究人员将该模型以开源方式发布，目�已被用于开发更多廉价的 AI 技术。初创公司 Bespoke Labs 利用它对 DeepSeek 的技术�次进行了蒸馏，得到一个在编程和数学问题上表现�
��异的新模型。

“蒸馏在为已有模型添加新功能方面非常有效，”加州大学伯克利分校的计算机科学教授 Ion Stoica 这样评价。

目�，AI 行业竞争已经非常激烈，大多数公司都在为争夺市场份额而亏�运营。DeepSeek 以及其他使用蒸馏技术的公司加入之后，可能会进一步压低价格，造成一个循环：投入巨资做高端研究越来
越难以在商业上站得住脚。

过去一年里，开发者通过 OpenAI 等模型获取�务的价格已经显著下�。像 DeepSeek 这样的开源 AI 预计只会让成本�得更低，很多科技行业高管都认同这一点。

“这�级别的智能，很难�维持过去那�巨大的利润率了，”Together AI 的首席执行官 Vipul Ved Prakash 说，该公司主要为 AI 应用的开发者提供算力�务。

如需与作者联系

Miles Kruppa: [email protected]

Deepa Seetharaman: [email protected]

该报道于 2025 年 1 月 31 日的�刷版中刊登，标题为《更廉价的 AI 路径让巨头们心惊胆战》。

频道推�：经济学人中文版

[0] [email protected]:
[1] 经济学人中文版: https://t.me/econo202

2025-01-31T15:46:46+0000

--
Mobot

If you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.

--- SoupGate-Win32 v1.05
* Origin: fsxNet Usenet Gateway (21:1/5)

Who's Online
Recent Visitors
- Rixter
  Wed Jul 29 02:00:40 2026
  from Madison, Nc via Telnet
- Centurion
  Tue Jul 28 22:54:59 2026
  from Berea, Ohio via Telnet
- Bob Worm
  Tue Jul 28 16:01:18 2026
  from Wales, Uk via Telnet
- Rixter
  Tue Jul 28 13:42:46 2026
  from Madison, Nc via Telnet
- Krenn
  Tue Jul 28 11:59:57 2026
  from Sydney, Nsw via Telnet
- Rixter
  Tue Jul 28 01:23:48 2026
  from Madison, Nc via Telnet
- Centurion
  Mon Jul 27 22:50:42 2026
  from Berea, Ohio via Telnet
- Ataricrypt
  Mon Jul 27 19:19:17 2026
  from England via Telnet

System Info

Sysop:	Keyop
Location:	Huddersfield, West Yorkshire, UK
Users:	741
Nodes:	16 (2 / 14)
Uptime:	58:14:37
Calls:	12,446
Calls today:	1
Files:	15,192
Messages:	6,537,395

=?utf-8?Q?[WSJ]=20#=E4=BA=BA=E5=B7=A5=E6=99=BA=E8=83=BD=20=E4=B8=BA=E4=

Who's Online

Recent Visitors

System Info