XPost: alt.chinese.text
DeepSeek与OpenAI的AI模型究竟有何�同?
DeepSeek声称其最新的AI模型R1尤其擅长解决问题,在性能上与OpenAI的o1推理模型�相上下,但每次使用的成本�低得多。 图片来源:Andre M. Chang/Zuma Press
Belle Lin
2 - 3 minutes
很难�拿中国AI初创公司DeepSeek的新AI模型与��龙头地�的美国竞争对手OpenAI相比较。
DeepSeek声称其最新的AI模型R1尤其擅长解决问题,在性能上与OpenAI的o1推理模型�相上下,但每次使用的成本�低得多。DeepSeek的一款应用程序目�在美国iPhone下载排行榜上�列榜首。
但正如DeepSeek和OpenAI是截然�同的两家公司,R1和o1也是两��一样的技术。以下是这两�技术在五个方面的异同点。
《�尔街日报》(The Wall Street Journal)�公司新闻集团(News Corp)与OpenAI有内容授权合作关系。
DeepSeek的工作原理
《�尔街日报》此�报道,DeepSeek减少了训练模型所需要的数�处理量,�仅利用了自己的发明,还采用了其他受限的中国AI公司所采用的技术。
除了减少数�处理量(这压缩了大量的训练时间和计算成本),DeepSeek还使用一��为“专家混合”(mixture of experts)的技术。DeepSeek和其他一些AI开发人员的做法类似于将问题交给特定领域的专家�
��每个专家需要的训练量都比较少,从而减轻了芯片同时处理所有任务的压力。
“他们采用的技术本身并�新鲜,但他们在如此大的规模上应用这些技术,并且如此坚信这些技术,这是很新颖的,”基于AI的互联网隐私平台Loti AI的首席执行官�克·阿里戈尼(Luke Arrigoni)说。
DeepSeek采用的方法在用户向AI模型提问�需要更少的时间和算力,但在回答问题时需要更多的时间和算力。AI初创公司Fireworks AI的首席执行官兼联合创始人Lin Qiao表示,这个模型通过“思维链”(
chain-of-thought)推理来展示自己是如何得出答案的,能一步一步地更好地完成一项�杂任务。
Lin Qiao说,OpenAI的o1模型也使用了思维链推理,但没有向用户展示背后的步骤。她还说,DeepSeek模型产生的推理可以用来训练更小的AI模型,这让其更进了一步。
o1和DeepSeek的R1都能完成所谓的“推理”任务,比如撰写商业计划书或创建填字游戏。
性能
DeepSeek背后的研究人员表示,他们用R1与OpenAI的一些顶级AI模型进行了测试,发现R1非常有竞争力。这些评估中包括由OpenAI开发的一项测评,让AI模型自行完成计算机编程任务,比如修�软件漏洞�
�
R1的性能与OpenAI的o1相当,优于�为o1-mini的早期模型。
Lin Qiao说,开源社区的成员已经创建了一个小得多的R1版本,可以在手机和平板电脑上使用。
一些用户表示,R1的写作和解决问题的能力令人惊叹。但他们也指出,在解决某些特定类型的问题方面,该模型的表现�如OpenAI的o1等竞争对手。
OpenAI首席执行官阿尔特曼(Sam Altman)周一在X上发帖称,R1是“一款令人�象深刻的模型,特别是考虑到能以这个价格交付产品”。他还表示,出现一个新的竞争对手令人振奋,他的公司将提�发布
一些产品。
成本
DeepSeek宣称自己以更低的成本实现了与OpenAI相媲美的结果,而且没有使用性能最高的芯片。Bernstein Research分析师斯泰西·拉斯贡(Stacy Rasgon)在一份研究报告中表示,�估计,DeepSeek在训练一个早期�
��型时只用到价值约500万美元的芯片,但这忽略了其研发过程中的研究和实验成本。
目�尚�清楚DeepSeek在更先进的R1模型上使用了多少算力。
相比之下,OpenAI表示,训练GPT-4模型的成本超过1亿美元,而未来的AI模型预计将耗费10亿美元以上。
根�公开和非公开估算,对OpenAI下一个模型GPT-5来说,仅计算成本一项,六个月的训练就可能花费约5亿美元。
隐私和安全
DeepSeek最新的旗舰模型V3的用户注意到,有关中国及其领导人习近平的敏感政治问题被拒绝回答。在某些情况下,这款产品的回应符合中国政府的宣传,而�是像ChatGPT那样包含政府批评者的观点�
��
�过,R1可以�费下载和使用,因此一些用户觉得在自己公司的�务器或美国公司托管的�务器上使用会更放心。AI初创公司Liner的首席执行官�克·金(Luke Kim)表示,该公司愿意使用DeepSeek的R1,�
�为它是开源的,而且更�AI模型很容易。
相比之下,OpenAI表示自己采用一�“新的安全训练方法”,强制其o1模型遵守该公司的准则。OpenAI表示,该公司希望避�AI模型被“越狱”,并与美国和英国的AI安全机构签署了正式�议。AI模型�
��狱指的是�纵模型或试图绕过其安全控制。
开源与专有
DeepSeek已发布了R1模型背后的“权�”(数值参数),供公众�费使用、下载和修改,但没有发布其背后的训练数�,导致一些人认为其模型也并非完全“开源”。
这家中国公司发布了一份报告,详细介�了自己是如何训练模型的。AI专家表示,这有助于开发人员破译DeepSeek是如何实现创新的。
发布模型权�也意味着开发人员可以下载模型来使用。运营开源模型共享平台的Hugging Face表示,其社区创建的R1模型已被下载了320万次。
与DeepSeek�同,OpenAI的o1是专有的,意味着消费者和企业要付费�能使用其模型和�务。虽然一些公司更喜欢使用专有技术,因为经过了创建者的审查,并内置了网络安全控制,但另一些公司更�
�欢开源技术,因为更容易定制和控制。
频道推�:经济学人中文版
[0] 中国AI初创公司DeepSeek的新AI模型:
https://cn.wsj.com/articles/WP-WSJS-0002354385
[1] 经济学人中文版:
https://t.me/econo202
https://cn.wsj.com/articles/how-deepseeks-ai-stacks-up-against-openais-model-0b39d67d
2025-01-29T07:59:03+0000
--
Mobot
If you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.
--- SoupGate-Win32 v1.05
* Origin: fsxNet Usenet Gateway (21:1/5)