XPost: alt.chinese.text
DeepSeek的崛起之路:从“炒股神器”到人工智能明星
MEAGHAN TOBIN, 孟建国, 艾莎
2025年2月6日
DeepSeek起源于金�,并非为发展技术本身而做技术。 Lam Yik/Bloomberg
两年�,当百度和阿里巴巴等知�中国科技公司通过发布夺人眼球的公告和新聊天机器人来追赶硅谷在人工智能领域的进展时,DeepSeek采取了�同的做法。它专注于研究。
这个策略奏效了。
这家中国初创公司称,它创建了一个功能强大的人工智能模型,其构建成本大大低于资金雄厚的美国竞争对手的产品,这一消息震惊了整个科技界。
在中美两国争夺人工智能主导权的竞争中,DeepSeek似乎横空出世。事实上,它近年来在中国科技界一飞冲天,走的完全�是传统路数。DeepSeek的研究使命与OpenAI等公司相似,OpenAI在2022年秋季为美�
��在人工智能领域做出了标志性的贡献。�过,它们的相似之处大多仅止于此。
DeepSeek起源于金�,并非为发展技术本身而做技术。它的�公司是一家�为幻方的中国对冲基金,起初并�是一家像OpenAI那样致力于保护人类�受人工智能侵害的实验室,而是一家利用人工智能�
��中国股市下注的企业。
中国的散户投资者以冲动进出股市而闻�,幻方正是抓住了这一市场的机遇,得以蓬勃发展。2021年,幻方发现自己受到了中国监管机构打击投机的压力,政府认为这有悖于保持市场平稳的努力�
�
因此,幻方开始寻求一个新的机会,它认为这个机会更符合中国政府的优先事项:先进的人工智能。
“我们主要做的科技方向——只是大家习惯把我们局限在投资领域,AGI有大得多的用处和大得多的价值,”2023年,幻方首席执行官陆政哲对中国官方媒体说。“我们独立于投资新成立了一个团�
�,相当于二次创业。”
DeepSeek应运而生。与其他许多中国初创企业一样,它以�同的商业模式进入了一个成熟的市场。
�信,DeepSeek的最新人工智能模型几乎与美国竞争对手一样强大,但效率�高得多。它的成功表明,硅谷在人工智能领域的领先优势已经缩小。尽管�盛顿努力限制中国获得人工智能所需的先进�
��片,但DeepSeek的突破还是让人怀疑这些控制措施是否长期有效——尽管DeepSeek的创始人承认芯片限制是一个问题。
DeepSeek在北京的办公室。 Peter Catterall/Agence France-Presse — Getty Images
DeepSeek并没有依靠生产面向消费者的人工智能产品来获取收入,直到本月�发布了第一个聊天机器人,任何人都可以通过简�的命令生成文字和照片。实际上,该公司利用幻方从股票交易中赚到�
��钱来资助雄心勃勃的研究。这�做法使它有别于美国的竞争对手,因为它们从根本上都是消费技术公司。
这�非常规方法也让DeepSeek得以避开中国政府对公众使用的人工智能的严格监管。由于该公司专注于研究,并向使用其模型的企业销售产品,而在本月发布聊天机器人之�,并�面向消费者应用�
��因此其早期工作并未引发同样的政府限制。DeepSeek的首席执行官梁文锋是一�戴眼镜的清瘦工程师,曾就读�于杭州的浙江大学。他在接受中国媒体的几次采访中��表示,要赶上美国的创新�
�伐,中国公司必须把研究放在利润之�。DeepSeek和幻方都没有回应置评请求。
梁文锋在接受中国科技媒体36氪的一次广为流传的采访时说,中国科技公司“缺的�是资本,而是缺乏信心以及�知道怎么组织高密度的人�”。
根�采访和公开报道,与梁文锋共事过的人都认为他是一�有能力、有深厚技术背景的管理者。
曾参与DeepSeek早期模型开发的计算机工程师王子涵(音)说:“他绝对是个INTP,”他指的是迈尔斯·布里格斯测试中的一�内省型人格类型,这是一�在中国年轻人中很流行的人格测试。“INTP是
很好的研究者,他们喜欢探索,”王子涵说。“他�是那�想控制一切的人。”
他说,梁文锋�太在意项目时间表等细节,偶尔会向整个研究团队提出一些发人深省的研究问题。但最主要的是,梁文锋似乎以推动技术进步为动力,并�注�利润。
许多中国公司倾向于招聘程序员,梁文锋与他们�同,他出了�地会聘用计算机领域以外的人�。DeepSeek的员工中有来自中国顶尖大学的诗人和人文学科专业的学生,他们训练模型编写中国古典�
���,并解答中国难度很大的高考题。“团队中的大多数人都毕业于中国的顶尖大学,”旧金山巴塞顿公司的首席软件工程师张一能(音)说,他负责SGLang项目,该项目�是DeepSeek的一部分,而�
�帮助人们在DeepSeek系统的基础上进行构建。“他们非常聪明,也非常年轻。”
多年来,中国科技公司一直是计算机视觉领域人工智能应用,如面部识别的先驱。但是,OpenAI发布的ChatGPT引起了人们的�思。当没有一家中国公司立�发布可与之媲美的产品时,许多人得出结�
�:美国公司在先进的人工智能领域处于领先地�。
DeepSeek使用2000枚英伟达专用芯片训练其人工智能聊天机器人,远远少于美国领先公司使用的1.6万枚芯片。 Stella Kalinina for The New York Times
在中国,计算机科学家们决心证明自己能够与之竞争。2023年,中国的许多公司都发布了自己的大语言模型,该技术是ChatGPT等聊天机器人的基础。
但是,打造先进的模型需要使用大量芯片,这将花费数亿美元。
幻方也在投入大笔资金。到2021年,它已成为能够储备10000多枚英伟达高级A100芯片的少数中国公司之一。
然而,DeepSeek的研究为它带来了意外的优势。去年,它大幅�低了向使用其模型开发应用程序的开发者收取的费用,从而引发了一场与大型竞争对手的价格战。曾在DeepSeek工作的工程师王子涵说�
�公司很少讨论他们正在开发的技术的商业应用问题。相�,他说,公司的�点是打造一个人工智能系统,供�同的人用于�同的目的。
“我在那里工作期间,我们并没有过多地讨论如何赚钱,”他说。“他们只是专注于打造一个优秀的基础模型。”
DeepSeek广受欢迎的一个�要原因是,它公开了开发者的工作。这�被称为开放源代码的信息共享一直是计算机软件、互联网和人工智能发展的基石。
在美国,人工智能研究人员和企业家长期以来一直在关注DeepSeek的技术进展。去年,该公司发布了可自行生成计算机程序的系统,引起了广泛关注。
DeepSeek新的知�度可能带来新的挑战。就在上个月发布新聊天机器人R1的同一天,梁文锋出席了与中国总理李强的座谈会。
DeepSeek的突然走红将其推向了中国共产党激励创新的努力的中心,这可能会难以驾驭,联邦资助的智库兰德公司技术分析高级顾问吉米·古德里奇说。“这对DeepSeek来说是一个很严�的两难局面,
”他说。“我相信中国政府的五年计划中肯定没有他们。”“当党和世界都注视着他们,他们还能保持这�混乱而自由自在的愿景吗?”
本文最初发表于2025年1月28日。
Zixu Wang对本文有研究贡献。
Meaghan Tobin是时报科技记者,常驻台北,报道亚洲地区的商业和科技新闻,�点关注中国。点击查看更多关于她的信息。
孟建国(Paul Mozur)是时报全球科技记者,常驻台北。此�,他自香港、上海和首尔报道亚洲科技与政治的交叉议题。点击查看更多关于他的信息。
艾莎(Alexandra Stevenson)是《纽约时报》上海分社社长,报道中国经济和社会新闻。点击查看更多关于她的信息。
翻译:纽约时报中文网
[0] 第一个聊天机器人:
https://www.nytimes.com/2025/01/27/technology/deepseek-ai-chatbot-first-impressions.html
https://cn.nytimes.com/business/20250206/deepseek-owner-china-ai/?utm_source=RSS
Thu, 06 Feb 2025 05:17:09 +0800
--
Mobot
If you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.
--- SoupGate-Win32 v1.05
* Origin: fsxNet Usenet Gateway (21:1/5)