Forum: >>> Magnum BBS <<<

=?utf-8?Q?[WSJ]=20DeepSeek=E4=B8=8EOpenAI=E7=9A=84AI=E6=A8=A1=E5=9E=8B=

From Mobot@21:1/5 to All on Wed Jan 29 08:34:37 2025

XPost: alt.chinese.text

DeepSeek与OpenAI的AI模型究竟有何�同？

DeepSeek声称其最新的AI模型R1尤其擅长解决问题，在性能上与OpenAI的o1推理模型�相上下，但每次使用的成本�低得多。图片来源：Andre M. Chang/Zuma Press

Belle Lin

2 - 3 minutes

很难�拿中国AI初创公司DeepSeek的新AI模型与��龙头地�的美国竞争对手OpenAI相比较。

DeepSeek声称其最新的AI模型R1尤其擅长解决问题，在性能上与OpenAI的o1推理模型�相上下，但每次使用的成本�低得多。DeepSeek的一款应用程序目�在美国iPhone下载排行榜上�列榜首。

但正如DeepSeek和OpenAI是截然�同的两家公司，R1和o1也是两��一样的技术。以下是这两�技术在五个方面的异同点。

《�尔街日报》(The Wall Street Journal)�公司新闻集团(News Corp)与OpenAI有内容授权合作关系。

DeepSeek的工作原理

《�尔街日报》此�报道，DeepSeek减少了训练模型所需要的数�处理量，�仅利用了自己的发明，还采用了其他受限的中国AI公司所采用的技术。

除了减少数�处理量（这压缩了大量的训练时间和计算成本），DeepSeek还使用一��为“专家混合”(mixture of experts)的技术。DeepSeek和其他一些AI开发人员的做法类似于将问题交给特定领域的专家�
��每个专家需要的训练量都比较少，从而减轻了芯片同时处理所有任务的压力。

“他们采用的技术本身并�新鲜，但他们在如此大的规模上应用这些技术，并且如此坚信这些技术，这是很新颖的，”基于AI的互联网隐私平台Loti AI的首席执行官�克·阿里戈尼(Luke Arrigoni)说。

DeepSeek采用的方法在用户向AI模型提问�需要更少的时间和算力，但在回答问题时需要更多的时间和算力。AI初创公司Fireworks AI的首席执行官兼联合创始人Lin Qiao表示，这个模型通过“思维链”(
chain-of-thought)推理来展示自己是如何得出答案的，能一步一步地更好地完成一项�杂任务。

Lin Qiao说，OpenAI的o1模型也使用了思维链推理，但没有向用户展示背后的步骤。她还说，DeepSeek模型产生的推理可以用来训练更小的AI模型，这让其更进了一步。

o1和DeepSeek的R1都能完成所谓的“推理”任务，比如撰写商业计划书或创建填字游戏。

性能

DeepSeek背后的研究人员表示，他们用R1与OpenAI的一些顶级AI模型进行了测试，发现R1非常有竞争力。这些评估中包括由OpenAI开发的一项测评，让AI模型自行完成计算机编程任务，比如修�软件漏洞�
�

R1的性能与OpenAI的o1相当，优于�为o1-mini的早期模型。

Lin Qiao说，开源社区的成员已经创建了一个小得多的R1版本，可以在手机和平板电脑上使用。

一些用户表示，R1的写作和解决问题的能力令人惊叹。但他们也指出，在解决某些特定类型的问题方面，该模型的表现�如OpenAI的o1等竞争对手。

OpenAI首席执行官阿尔特曼(Sam Altman)周一在X上发帖称，R1是“一款令人�象深刻的模型，特别是考虑到能以这个价格交付产品”。他还表示，出现一个新的竞争对手令人振奋，他的公司将提�发布
一些产品。

成本

DeepSeek宣称自己以更低的成本实现了与OpenAI相媲美的结果，而且没有使用性能最高的芯片。Bernstein Research分析师斯泰西·拉斯贡(Stacy Rasgon)在一份研究报告中表示，�估计，DeepSeek在训练一个早期�
��型时只用到价值约500万美元的芯片，但这忽略了其研发过程中的研究和实验成本。

目�尚�清楚DeepSeek在更先进的R1模型上使用了多少算力。

相比之下，OpenAI表示，训练GPT-4模型的成本超过1亿美元，而未来的AI模型预计将耗费10亿美元以上。

根�公开和非公开估算，对OpenAI下一个模型GPT-5来说，仅计算成本一项，六个月的训练就可能花费约5亿美元。

隐私和安全

DeepSeek最新的旗舰模型V3的用户注意到，有关中国及其领导人习近平的敏感政治问题被拒绝回答。在某些情况下，这款产品的回应符合中国政府的宣传，而�是像ChatGPT那样包含政府批评者的观点�
��

�过，R1可以�费下载和使用，因此一些用户觉得在自己公司的�务器或美国公司托管的�务器上使用会更放心。AI初创公司Liner的首席执行官�克·金(Luke Kim)表示，该公司愿意使用DeepSeek的R1，�
�为它是开源的，而且更�AI模型很容易。

相比之下，OpenAI表示自己采用一�“新的安全训练方法”，强制其o1模型遵守该公司的准则。OpenAI表示，该公司希望避�AI模型被“越狱”，并与美国和英国的AI安全机构签署了正式�议。AI模型�
��狱指的是�纵模型或试图绕过其安全控制。

开源与专有

DeepSeek已发布了R1模型背后的“权�”（数值参数），供公众�费使用、下载和修改，但没有发布其背后的训练数�，导致一些人认为其模型也并非完全“开源”。

这家中国公司发布了一份报告，详细介�了自己是如何训练模型的。AI专家表示，这有助于开发人员破译DeepSeek是如何实现创新的。

发布模型权�也意味着开发人员可以下载模型来使用。运营开源模型共享平台的Hugging Face表示，其社区创建的R1模型已被下载了320万次。

与DeepSeek�同，OpenAI的o1是专有的，意味着消费者和企业要付费�能使用其模型和�务。虽然一些公司更喜欢使用专有技术，因为经过了创建者的审查，并内置了网络安全控制，但另一些公司更�
�欢开源技术，因为更容易定制和控制。

频道推�：经济学人中文版

[0] 中国AI初创公司DeepSeek的新AI模型: https://cn.wsj.com/articles/WP-WSJS-0002354385
[1] 经济学人中文版: https://t.me/econo202

https://cn.wsj.com/articles/how-deepseeks-ai-stacks-up-against-openais-model-0b39d67d

2025-01-29T07:59:03+0000

--
Mobot

If you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.

--- SoupGate-Win32 v1.05
* Origin: fsxNet Usenet Gateway (21:1/5)

Who's Online
Recent Visitors
- Rixter
  Thu Jul 30 14:17:17 2026
  from Madison, Nc via Telnet
- Krenn
  Thu Jul 30 13:16:49 2026
  from Sydney, Nsw via Telnet
- Bob Worm
  Thu Jul 30 09:03:28 2026
  from Wales, Uk via Telnet
- Bob Worm
  Thu Jul 30 08:47:34 2026
  from Wales, Uk via Telnet
- Bob Worm
  Thu Jul 30 08:36:06 2026
  from Wales, Uk via Telnet
- Rixter
  Thu Jul 30 02:32:09 2026
  from Madison, Nc via Telnet
- Bob Worm
  Wed Jul 29 22:26:45 2026
  from Wales, Uk via Telnet
- Zenobyte
  Wed Jul 29 21:08:05 2026
  from San Juan, Pr via Telnet

System Info

Sysop:	Keyop
Location:	Huddersfield, West Yorkshire, UK
Users:	741
Nodes:	16 (2 / 14)
Uptime:	90:58:10
Calls:	12,456
Calls today:	6
Files:	15,197
Messages:	6,537,867

=?utf-8?Q?[WSJ]=20DeepSeek=E4=B8=8EOpenAI=E7=9A=84AI=E6=A8=A1=E5=9E=8B=

Who's Online

Recent Visitors

System Info