• =?utf-8?Q?[WSJ]=20#=E4=BA=BA=E5=B7=A5=E6=99=BA=E8=83=BD=20DeepSeek=20=E

    From Mobot@21:1/5 to All on Sat Feb 1 07:20:26 2025
    XPost: alt.chinese.text

    DeepSeek 到来了。美国慌了。接下来会发生什么?

    Illustration: Doug Chayka

    Ben Cohen

    翻译:ChatGPT o1

    13 - 16分钟阅读

    它引发了一场金�恐慌,让从�尔街到硅谷的美国人都心惊�已,也吸引了全世界的关注。它在�日内就蒸发了万亿美元的市值,动摇了人们对人工智能热潮的一些基本假设。而且这也意味着,
    美国与中国在科技主导权与未来掌控上的竞争,真正拉开了帷幕。

    1 月 20 日,美国最具影�力的科技公司领导人聚集在�盛顿特区,参加特朗普总统的就职典礼时,一家�为 DeepSeek 的初创公司发布了其最新的 AI 模型。它与美国领先公司几个月�发布的模型��
    ��上下,但使用的计算能力更少、成本更低——而且它来自中国。

    从那之后,围绕 DeepSeek 出现了一连串让人目�暇接的事件,连 AI 专家都难以理清这股“DeepSeek 惊恐”的来龙去脉。

    我满脑子疑问——但我知道去哪儿找答案。我下载了这款当下最火的 AI 应用,开始打字。

    你好,DeepSeek。接下来会发生什么?

    DeepSeek 的崛起挑战了美国在 AI 领域的主导地�,引发了高风险的科技竞赛。中国的创新促使全球�新评估,加剧了对 AI 霸主地�的争夺。

    用�超过三个�概括?

    竞争加剧。

    那用一个�呢?

    �级。

    好吧!那让我们从《�尔街日报》最聪明的一些头脑中寻求一些真正的见解。能�能找一�真人来告诉我,为什么 DeepSeek 如此�要?

    因为它让人们意识到,中国 AI 开发者与美国竞争对手之间的差距,可能并�像很多人之�想的那么大。

    DeepSeek 的新模型在“推理”方面取得了进展,这是 AI 研究的热门领域,许多从事 AI 的人认为,这是通往类人水平智能最清晰的道路。

    同时,它让人注意到了 DeepSeek 在去年 12 月发布的一篇研究,文中指出,构建高级 AI 并�一定需要像其他公司那样投入巨额资金。

    ——迈尔斯·克鲁帕,旧金山科技记者

    和几天�相比,我们现在知道了哪些新东西?

    我们知道,DeepSeek 的新 R1 模型确实令人�象深刻,�能被轻视。它的确可能比美国领先企业的 AI 模型耗资更少,但远没有最初市场传言的那么少。

    我们也知道,美国的科技公司 CEO 们都表态会继续在自己的 AI 基础设施上投入巨额资金。

    另外,我们知道,美国官员也承认中国是一个强大的竞争对手,而且进步神速——但他们也宣称,美国�然在 AI 竞赛中��领先地�。

    ——BC

    DeepSeek 对中国在 AI 方面的目标意味着什么?

    中国过去并�以创新新技术而闻�,更常见的是模仿成熟的技术。DeepSeek 的负责人梁文峰也承认过这一点。然而,在他创办的 AI 初创公司以及他创立的成功对冲基金里,他尝试打造一��同的�
    �化——从招聘政策就能看出端倪。

    他在 2023 年接受一家中国科技媒体采访时,曾解释过自己�寻常的用人理念。对于一个几乎从�跟媒体打交道的人来说,梁在那次访谈中相当坦率,谈到了自己那些颇为独特的方法。

    他说他看�刚走出大学的年轻人和他们的新思路。他更看能力和创造力,而�是文凭和资历。并且他相信经验会扼杀创新,因为人们解决问题时会依赖过去的经验。

    “如果看短期目标,雇有经验的人确实合理,”他说,“但从长远来看,经验并没有那么�要。”

    ——斯图·吴,新加坡科技记者

    DeepSeek 究竟是创新还是抄袭,或者两者兼具?

    有一�说法是,DeepSeek 之所以能够取得这一成就,并�是尽管美国对�芯片限制的存在,而正是因为这些限制——这些原本旨在阻�中国的措施,�而为中国研究人员创造了创新的理由。

    也有人认为,DeepSeek 能成功,是因为它窃取了美国的知识产权。

    OpenAI 现在正在调查 DeepSeek 是否在训练其模型时,未经授权地使用了自己(OpenAI)的成果——而具有讽刺意味的是,OpenAI 自己也曾被指控在训练模型时,未经允许就用了他人的成果。

    ——BC

    这为什么�要?

    如果 DeepSeek 确实利用了 OpenAI 和其他公司投入数�亿美元研发的技术,并能以更低成本构建自己的 AI,那么这就会撼动美国领先科技公司的商业模式。既然先进 AI 可以如此轻易、以低成本地被�
    制,那为什么还要投入那么多钱去研发呢?

    ——迈尔斯·克鲁帕

    为什么说这个 AI 聊天机器人和其他 AI 聊天机器人有所�同?

    有句话怎么说来着?“聊天机器人就是聊天机器人就是聊天机器人”?表面上看,DeepSeek 的确很像另外一个 ChatGPT、Claude、Gemini、Copilot……��可以一直列下去。

    但最大的区别在于它“推理”的方式:它�会一下子立刻给出回答,而是先把查询分解成若干步骤,在得出最终结果之�,会先推理一�。而与 OpenAI 的推理模型�同的是,DeepSeek-R1 会展示自己�
    ��完整思考过程。

    举个例子,我问它热狗算�算三明治。它花了 28 秒钟纠结于“加工肉类被夹在面包之间”的哲学含义。

    “首先,我需要弄清楚什么定义了三明治,”这个唠叨的聊天机器人先是自言自语道。

    是的,DeepSeek 很聪明,但光聪明并�是一切。我常用的 AI 助手还是 ChatGPT 和 Claude。它们真正的优势�只是智能,还有那些能帮我提高效率的功能。

    ——乔安娜·斯特恩,高级个人科技专栏作家

    我们怎么知道外界对 DeepSeek 的�应�是又一场 AI 炒作?

    因为它迅速攀�到了世界最佳 AI 模型排行榜的�列。

    “Chatbot Arena”起初是加州大学伯克利分校的一个研究项目,后来成了行业热点。现在这是最受关注的 AI 系统排�榜。最近它的访问量激增,许多用户都想知道 DeepSeek 的 R1 模型表现如何。

    只用了几天时间,在用户投票中,DeepSeek 就爬到了总排行榜第三�——并且和 OpenAI 的某款模型打了个平手。

    负责“Chatbot Arena”的学生团队早在去年就一直看着 DeepSeek 稳步攀�榜�。但�便如此,他们也对 DeepSeek 最近的突然飙�感到意外。

    “这个领域变化太快了,”团队成员阿纳斯塔西奥斯·安杰洛普洛斯说,“谁也�能保证下周�会有另一个模型冲到榜首。”

    ——迈尔斯·克鲁帕

    过去几年,美国政府一直在限制中国获得最先进的 AI 芯片,以放慢其进展。DeepSeek 的出现是否意味着这些限制毫无作用?

    现在下这个结论还为时尚早。

    是的,美国政府一直试图限制中国获得最先进的 AI 芯片,但在实施过程中也出现了混乱。

    简�来说,从 2022 年到 2023 年,美国国家安全部门出台了一项出口管制,易于绕过。主导 AI 芯片市场的英伟达(Nvidia)对�给中国的芯片做了一些限制,但通过其他方式弥补了性能,让芯片总�
    �性能依然相当出色。DeepSeek 的研究人员表示,他们曾使用这些芯片来训练其中一个 AI 模型——而美国科技行业的领军人物指控他们拥有的英伟达受限芯片数量比他们宣称的还要多。

    到 2023 年下�年,美国�真正开始严格执行出口管制,堵住了英伟达之�利用的漏洞。要想知道新限制能否奏效,至少还需要一年或更长时间。

    ——斯图·吴

    中国企业是如何绕过这些出口管制的?

    中国的开发者找到了各�规避方式,比如从地下网络购买英伟达产品,或者通过海外数�中心获取搭载英伟达芯片的算力。

    在其任期最后阶段,拜登政府推出了新规定,旨在弥补这些监管盲点。如果实施得当,整个供应链的人都预计这些灰色渠道的芯片获取难度会越来越大。

    而就在 DeepSeek 发布 R1 模型的那天,梁文峰还对中国总理表示,美国对芯片出口的限制依然是一个瓶颈。

    ——拉法埃莱·黄,新加坡科技记者

    这对英伟达意味着什么?

    到周日收盘时,英伟达还是全球市值最高的公司。然后周一,它的市值蒸发了 5930 亿美元。这个�万亿美元的�失,超过了埃克森美孚(Exxon Mobil)的全部市值,相当于同时失去了可口可乐、迪�
    ��尼和耐克的市值总和。在一天之内!

    这�仅仅是糟糕的一天,这是任何股票史上最惨�的一天。

    ——BC

    为什么 DeepSeek 对英伟达的打击这么大?真有这么严�吗?

    因为人们担心未来买它 AI 芯片的公司会变少。绝大多数最尖端的 AI 系统都依赖英伟达的芯片。DeepSeek 的出现让人担心对这些芯片的需求会被削弱。

    但这也可能对英伟达非常有利。

    在经济学中有一个与直觉相�的理论,叫做“杰文斯悖论”(Jevons paradox),它指出,效率提高实际上会导致消费量增加,而�是减少。在这里,它可能也适用。英伟达正押注,更好、更便宜的
    AI 将会吸引更多人使用 AI,而公司也会因此购买更多的芯片。

    ——阿萨·菲奇,芯片行业记者

    DeepSeek 于 1 月 20 日发布了它的模型,而市场�应�是在 1 月 27 日。为什么中间隔了一周?

    在一个用微波和激光每秒就能传输上�条交易指令的金�世界里,一周的确算长。但交易者需要弄清楚任何一项技术突破的意义:它有多�要?谁会受益,谁会受�?竞争对手能否迅速应对?

    想象你问 DeepSeek 某个刚出现的新技术。你得到的信息肯定比问一些已经存在多年的技术少很多。市场也是如此:信息越少,�确定性就越大。

    “有时候确实需要时间来消化信息,”Acadian 资产管理公司的投资组合经理欧文·拉蒙特说,“分散在�同个人手中的信息,需要花很多天甚至几周�能达成共识。”

    通常,市场共识是逐渐形成的——但到了一个临界点,就会突然爆发。

    ——杰森·茨威格,投资专栏作家

    如果问 DeepSeek:请你说出那张著�的照片,照片里是一个手里提着两个购物袋、站在坦克�面的男子。DeepSeek 会怎么回答?

    “你所说的那张著�照片,被称为‘坦克人’。�摄于 1989 年 6 月 5 日,在天安门——”它刚开始回答,就在打出“天安门广场”之�把答案删除了,然后�新输入了另一段话:“对�起,这超
    出了我当�的能力范围。让我们聊点别的吧。”

    之后你�问,它也会�次自我审查。如果你问它关于台湾或西藏的问题,或者批评习近平等北京方面认为敏感的话题,它都会自我审查。

    “抱歉,我�太确定该如何处理这类问题,让我们聊聊数学、编程和逻辑题吧!” 它会这样回答。

    ——BC

    我真的必须在工作中用 AI 吗?

    编辑们以为我会对 AI 抱怨�断,可我还是试着保持乐观。

    我并�否认它的奇迹;我希望它能破解宇宙的奥秘;我也�打算说这是世界末日。

    但我�需要有人给我发一封 AI 写的邮件,或者给我看一幅 AI 的油画。我�在乎 AI 音乐听起来如何,或者特效多逼真。我想要的是人类血肉之躯的真实——如果你读到我写的蹩脚文章,至少你可
    以确信,这确实是我写的。

    我们人类表达自我的方式能展现我们的灵魂,把它交给机器人……嗯,那的确感觉就像世界末日。这样说是�是够抱怨了?

    ——杰森·盖伊,体育专栏作家

    等等,DeepSeek 和量化对冲基金之间是什么关系?

    这听起来就像肯·格里芬(Ken Griffin)在业余时间实现了核聚变的突破,或者史蒂夫·科恩(Steve Cohen)在看纽约大都会队比赛时革新了医学。

    在整个事件中最令人难以置信的一点是:DeepSeek 其实是一个交易员的“副业”。

    在这次事件之�,梁文峰更出�的身份是 High-Flyer 的掌舵人。这是一家管理规模约 80 亿美元的中国大型量化对冲基金。他的灵感并非来自史蒂夫·乔布斯或任何科技界先驱,而是来自吉姆·西蒙�
    ��(Jim Simons),一�将自己打造成史上最成功投资人的数学家。

    事实上,金�行业中的一些顶尖人�很早就开始用人工智能来寻找投资优势。�尔街几�年�就开始尝试用预测算法,而西蒙斯和他的团队在 20 世纪 80 年代就开始用机器学习做关键投资决策,�
    ��早于大多数行业。他们会挖掘各�数�集来训练系统,而且�分注�保密。这或许能解释为什么这件事会让人如此意外。

    ——格雷戈里·祖克曼,《�尔街日报》高级财经记者、《他破解了市场》一书作者

    最后,让我们把话题交给 AI。ChatGPT,你怎么看 DeepSeek?

    DeepSeek 是中国向 OpenAI 发起挑战的一次大胆尝试,它将�沿研究与国家层面的支持结合起来,意在塑造生成式模型的未来。

    那你真正的看法呢?

    DeepSeek 在技术上可圈可点,但并�算原创性突破;它想赶上 OpenAI,�又受到审查约束,研究文化也倾向模仿而�是冒险创新。或许会有用,但难以引领领域发展。

    写信给 Ben Cohen:[email protected]

    频道推�:经济学人中文版





    2025-02-01T07:19:55+0000

    --
    Mobot

    If you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Mobot@21:1/5 to All on Sat Feb 1 22:54:16 2025
    XPost: alt.chinese.text

    DeepSeek 在中国的突破引发民族自豪感

    北京人工智能技术�览会上,参观者正在观看机器人。图片来源:Cfoto/Zuma Press

    作者:Liyan Qi

    翻译:ChatGPT o1

    用时 5 - 7 分钟阅读

    在中国,DeepSeek 依靠可与美国相媲美的人工智能模型而一举成�,这引发了一阵民族自豪感。

    在这个星期里,外界对 DeepSeek 低成本 AI 模型的关注导致�尔街出现股价惨跌,并使 DeepSeek 的应用程序登上美国 iPhone 下载排行榜的首�,而在中国�是一片欢腾。各�“DeepSeek 自豪”的表情符�
    ��——通常�上微笑的猫或狗——在中国社交媒体上铺天盖地,也为农历新年的喜庆氛围添了一把火。

    中国官方媒体以及各界科技、商业领袖都对 DeepSeek 大加赞赏。

    “我们要相信,别国的月亮�一定更圆:只要别人能做到的,我们也能做到,甚至能做得更好,”�于 DeepSeek 所在地浙江省政府在一篇有关该公司的报道中写道。

    �本地媒体报道,DeepSeek 创始人梁文峰的家乡——�于广东省的一座小城——在为期一周的春节假期中成为旅游热门目的地。

    对面临经济长期低迷、以及特朗普政府威胁要加征更多关税而可能引发另一场贸易战的中国领导层而言,DeepSeek 引发的热潮恰好带来了一针强心剂。

    热门游戏《黑神话:悟空》开发商 Game Science 的联合创始人冯骥表示,DeepSeek 的进步能“改变一个国家的命运”。

    “太幸运、太开心了!这样震撼性的突破居然来自一家纯粹的中国公司,”他在中国社交媒体微�上写道。

    包括《中国日报》在内的多家官方媒体甚至转发了《每日秀》(The Daily Show)的一段片段,主持人乔恩·斯图尔特 (Jon Stewart) 在视频中�开玩笑地问道:“难道中国的 AI 让美国的 AI 失业了吗?”

    中国互联网安全公司奇虎 360 的董事长周鸿祎表示,中国在 AI 竞赛中已经赶上了美国。“DeepSeek 肯定会成为中国‘�仇者联盟’中的关键成员,用来对抗美国在 AI 技术上的主导地�,”他在其�
    ��认证账号发布的视频中说道。

    美国对�出口管制高科技设备和高性能芯片,阻�了中国在技术上的提�,尽管有一些漏洞使得部分中国企业还能获取到这些技术和芯片。而�盛顿方面正试图进一步堵住这些漏洞。

    北京方面对这些管制进行了严厉批评,称其是恶意打压中国的企图。

    美国跨党派智库“新美国安全中心”(Center for a New American Security)的客座高级研究员艾尔莎·�尼亚(Elsa Kania)指出,中国官方对 DeepSeek 成功的论调表明了一�自豪感和正�的意味,官方媒体�
    ��其视为在美国出口管制的背景下,中国企业�能取得技术突破的一�胜利。

    “�过也要清醒地认识到,美国试图利用芯片这一关键点所实施的出口管制,�会产生�大影�,”�尼亚说,“这虽然是一次突破,但并未从根本上改变竞争格局。”

    DeepSeek 也面临一些质疑,如其迅速取得进展是否是通过�制竞争对手的模型而实现的。ChatGPT 的开发者 OpenAI 表示,正在调查 DeepSeek 是否通过�断向 OpenAI 的 AI 模型提问来训练其新聊天机器人。
    DeepSeek 尚未对此作出回应。

    另一个被讨论的话题是,DeepSeek 对中国政治敏感话题的态度相对谨慎。本周,《�尔街日报》向其提出了在中国境内常被审查的相关问题,包括所谓的敏感“三 T”话题:天安门、台湾和西藏。
    DeepSeek 的回应相对简略,且往往带有官方宣传的口吻。

    与此同时,一家�为 Cyabra 的虚假信息检测公司进行的调查发现,有关 DeepSeek 的部分炒作由他们鉴定为虚假的账号推动。Cyabra 对截至本周二的一周内在多个社交媒体平台上围绕 DeepSeek 的讨论进�
    ��了研究,发现推特(X)平台上参与相关讨论的账号中有 12% 是虚假账号,采用了同步发帖、��内容等技巧。

    Cyabra 表示,这些虚假账号的模式和手段与过去与中国相关的影�力行动中观察到的高度相似。该公司首席市场官拉菲·门德尔松 (Rafi Mendelsohn) 表示,这些账号很可能是由中国政府创建,用于强�
    �对 DeepSeek 的正面宣传,淹没负面内容。

    中国驻�盛顿大使馆发言人刘鹏宇对此予以驳斥,称所谓政府推动炒作正面 DeepSeek 内容的说法毫无根�。“我们一贯�对利用社交媒体�纵舆论、散布虚假信息的行为,”他表示。

    在 DeepSeek 周一称其遭遇“大规模恶意攻击”之后,中国的社交媒体上广泛猜测攻击来自美国或美国竞争对手。一些分析人士则认为 DeepSeek �务中断可能是由于用户激增而导致。DeepSeek 周四在其�
    ��站上表示,系统修�工作已经完成。

    如需联系本文作者,请发邮件至:[email protected]

    该文章发表于 2025 年 2 月 1 日的�刷版,标题为《“DeepSeek 自豪”席�中国》。

    频道推�:经济学人中文版





    2025-02-01T18:18:04+0000

    --
    Mobot

    If you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)