Forum: >>> Magnum BBS <<<

=?utf-8?Q?[WSJ]=20#=E4=BA=BA=E5=B7=A5=E6=99=BA=E8=83=BD=20=E5=A6=82=E4=

From Mobot@21:1/5 to All on Thu Jan 30 01:12:18 2025

XPost: alt.chinese.text

如何凭借�费软件策略让 DeepSeek 一举跻身 AI 明星行列

DeepSeek 将其技术开源的目的之一可能只是为了最大限度地提高其知�度。图片：joel saget/Agence France-Presse/Getty Images

作者：Belle Lin

翻译：ChatGPT o1

阅读时长约 5-6 分钟

DeepSeek 这家中国人工智能公司，凭借其全新 AI 模型在硅谷掀起轰动，而其成功部分归功于一个由来已久的策略：�费开放其技术。

这�被称为开源（open-source）的方法，让公司可以�费发布技术，供公众使用、共享和修改。长期以来，这被视为新兴公司用来打破大型、闭源竞争对手垄断地�的一�常见手段。那些�愿意��
��分享技术的大公司，往往更倾向于封闭式开发。

在本例中，DeepSeek 正面挑战的是 ChatGPT 聊天机器人背后的公司 OpenAI。根�一些分析师的估计，OpenAI 在全球生成式 AI 市场中��了 80% 的份额。DeepSeek 表示，其模型在解决问题方面表现出色，与
OpenAI 的 o1 推理模型�相上下，但每次使用的成本�只有后者的一小部分。

并非只有 DeepSeek 在利用开源策略挑战 OpenAI。其他一些 AI 初创企业（如 Mistral AI、Hugging Face、Runway AI 和 Together AI）也同样选择了开源方式发布其技术。大型科技公司也在这样做：Meta Platforms 于
2023 年开源了其 Llama 模型，谷歌去年也发布了�为 Gemma 的开源模型。

�过，DeepSeek 的 R1 模型是否真正符合标准的开源软件定义，在业内�有争议。市场研究和 IT 咨询公司 Gartner 专门研究 AI 的分析师 Arun Chandrasekaran 指出，DeepSeek 虽然公开了其 R1 模型的“权�”�
��模型的数值参数），供大众�费使用、下载和修改，但并未公布背后的训练数�。美国的 Meta 也采取了类似的做法，��然称其模型为“开源”。

然而，�费意味着开源技术能够迅速吸引大批对新技术感兴趣的开发者�来尝试。通过这�方式，它们构建了一个所谓的“生态系统”，让工程师们基于这些技术开发自己的版本，助推其影�力
远远超越原始研发者的设计范围。

提供开源模型分享平台的初创企业 Hugging Face 表示，其社区已经基于 DeepSeek 的 R1 模型创建了 617 个�生模型，总下载量超过 300 万次。

“在人工智能的发展中，开放会带动各个方面的进步。”密歇根大学机器人学教授 Jason Corso 表示，“他们为更广泛的 AI 社区提供了研究和验证其方法论的机会，并能将其�入各自的工作中。”

如果 DeepSeek 的新 R1 模型是专有的或者需要付费使用，那么独立开发者就�太可能花力气来构建并分享他们对该技术的改进。如今，谁能赢得开发者的青睐，谁就更有可能在 AI 领域站稳脚跟，尤
其是在 OpenAI 和 Anthropic 等 AI 公司还在激烈争夺工程师为其技术平台开发应用之际。

那些基于开源技术打造产品的初创公司，也更有可能采用像 DeepSeek 这样功能强大且成本更低的模型，从而帮助将这家中国公司的 AI 模型嵌入到面向消费者和企业的各类新产品和�务中。

美国企业也纷纷对此表现出浓厚兴趣。一些企业技术主管表示，他们希望这能让所有人的 AI 成本都随之下�。

“到这个月底还会出现另一个‘DeepSeek’，今年在美国和全世界都会涌现出更多类似的公司。”非营利组织 Linux 基金会（Linux Foundation）的执行董事 Jim Zemlin 表示，该基金会主要支持开源技术的�
�展。

公司之所以会对技术进行封闭，一大原因是想阻止竞争对手获得它。但实际上，�便技术�公开，也很难阻止它被传播。OpenAI 周三表示，他们正在调查 DeepSeek 是否通过多次查询 OpenAI 的模型来�
�练自己新的聊天机器人。

毫无疑问，开源策略也存在风险。并�能保证�费技术一定能赚钱，因此一些公司会在自己的开源模型之上，出售面向企业的高级�务或应用。还有一些公司�费提供功能较弱的模型，最强大的
则收费。

对于企业来说，开源技术可能是一面“警示旗帜”，因为它们对将未经验证的技术引入公司内部�分谨慎。专家指出，开源让攻击者更容易找到并利用潜在的网络安全漏洞，但开源也能带来更高
的定制化和可控性。

“开源权�的模型缺乏内置的安全认证，合规风险完全落在部署该技术的组织身上。”专注金�科技与咨询的 Synechron 公司全球 AI 主管 Ryan Cox 表示。

�过，对于 DeepSeek 来说，其目标或许只是尽最大程度地扩大知�度，并向美国的 AI 巨头证明自己能开发出一款功能强大且成本更低的技术。

“他们意识到自己手上有一个非常强大的模型，于是说：‘机会来了，让它快速火起来吧。’”Gartner 的 Chandrasekaran 表示，“而让它快速火起来的方式之一，就是把它做成开源。”

如需联系本文作者 Belle Lin，请发邮件至：[email protected]

频道推�：经济学人中文版

2025-01-30T01:11:35+0000

--
Mobot

If you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.

--- SoupGate-Win32 v1.05
* Origin: fsxNet Usenet Gateway (21:1/5)

From Mobot@21:1/5 to All on Fri Jan 31 16:55:13 2025

XPost: alt.chinese.text

如何减少 AI 聊天机器人出现幻觉

Illustration: Adrià Voltà

作者：Bart Ziegler

翻译：ChatGPT o1

阅读时长：约 8 - 10 分钟

你无法完全阻止 AI 聊天机器人偶尔出现“幻觉”——�对提示给出误导性或错误答案，甚至凭空�造信息。然而，你可以采取一些措施，尽量减少它在回应你的请求时给出错误信息的几率。

波士顿咨询集团 (Boston Consulting Group) 下属部门 BCG X 的首席技术官 Matt Kropp 表示，AI 之所以会出现“幻觉”，有以下几个原因：其一，是用于训练 AI 聊天机器人的数�中关于你所询问主题的信息�
��身就存在冲突、�正确或�完整的情况。对此，你无能为力。其二，则是“你没有明确说明你想要什么，”Kropp 说——而这一点是你可以改进的。

下面是专家们给出的一些技巧，可帮助你最大程度地减少（但无法彻底杜绝）AI 产生的虚假信息。

1. 给 AI 提供详细的指令

告诉 AI 你想要的确切内容。如果你的提示过于宽泛，让它在自己的数�库中随意“翻找”，更有可能生成错误或虚假的信息。

“你需要使用详尽的指示，使用精确的语言，但也要确保提示简洁并与问题直接相关，”技术咨询公司 Gartner 的分析师 Darin Stewart 说。

我最近在选购汽车时，向一个 AI 聊天机器人寻求帮助。它为我提供了非常有用的对比信息，涵盖我感兴趣的 SUV 的尺寸、价格和�置。但其中有一款车的油耗（MPG 值）似乎高得离谱。深入调查�
�，我发现它给出的其实是柴油版车型的油耗——而那款柴油车型并未在美国销售。

另一个 AI 给我介�了一款 SUV 的某些特性，但与我在汽车制造商官网上看到的信息并�相符——原来该聊天机器人引用的是几年�的旧款车型�置，而非 2025 款。

要避�这些错误，我本该告诉这些 AI：我只想要美国市场上销售、且是当�在售车型的相关信息。

2. 分步骤结构化你的提问

专家建议，你应该将提问结构成若干个简明的直接问题，而�是一次性抛出一个开放式的大问题。可以一个接一个地提出这些问题——这一过程被称为“迭代式提示”（iterative prompting）。这样�
�能�低 AI 生成错误信息的概率，也能得到更有用的结果。

“我与 AI 模型的互动，�是一次提问、一次回答的关系，而更像是一场对话，”Kropp 说。“你在�断构建上下文。”

如果你想买一台新洗碗机，�要只问“我应该买哪款洗碗机”，而可以先这样提问：“我需要一台新的洗碗机。选购时有哪些主要功能需要考虑？”

在 AI 回答之后，你可以继续问：“哪些品牌以可靠性著称？哪些又应该避�？我该花多少钱？高价机型值得额外投入吗？”

为了进一步指导 AI，你还可以让它按某�固定的结构来回答，比如：

“请按以下结构来回答：先给一个概述，然后列出关键发现，�列出�同机型的优缺点，最后得出结论。请确保为每一个发现提供支撑证�。”

当我用这�提示向 AI 提问时，它生成了一份约 500 字的综合分析，告诉我该考虑哪些洗碗机、该避开哪些。就我所见，它并没有编造内容。

3. 指导 AI 使用可信来源

告诉 AI 使用某些类型的来源，可能会让它避�引用那些质量可疑、有偏见或错误的信息。

在我搜寻汽车信息的过程中，AI 有时会列出一些来自汽车爱好者网站或 Reddit 上匿�用户帖子的信息作为参考。这些帖子里有些内容看起来并�专业，或者带有误导性，或是过于吹�。

除了来源本身的质量外，AI 列出的引用也�一定可靠。专家表示，AI 给出的引用并�代表它的回答确实直接源自这些引用。实际上，AI 往往并�知道自己答案中的具体内容是来自哪里。此外，AI
也曾被发现引用并�存在的文件、研究或其他来源。

我��了之�的问题，但这次告诉 AI 只去看专业评测，并点�了我希望它参考的一些来源，例如《消费者报告》(Consumer Reports)、《Car and Driver》杂志以及汽车购物网站 Edmunds。我无法确认它是��
��确实用了这些来源——专家告诉我，我列出的来源可能会让 AI 倾向于选择类似但并�完全相同的材料。�过，它给出的答案确实更有参考价值，也几乎没有多少可疑的信息了。

约翰斯·�普金斯大学的研究人员发现了一�方法，可以让 AI 直接从其数�库中使用特定来源。只需在问题开头使用“According to Wikipedia（根�维基百科）”这样的话语，或者针对医疗健康问题�
�用“According to PubMed（基于 PubMed 数�）”，就能让 AI 直接引用这些来源，研究人员在报告中指出了这一点。

4. 告诉 AI �要编造

这听起来有点像老师警告顽皮学生“别作弊”，但有些专家认为，你应该明确告诉聊天机器人：“如果�确定就说�知道”或“�要凭空�造答案”。这样，也许可以让它在数�库中证��足时
，�要随便编造信息应付。

“你实际上是在给它一个‘许可’，让它去做一件原本没有经过专门训练的事——承认‘我错了’或‘我�知道’，”Kropp 说。

5. 使用“元提示”（meta-prompt）来指导 AI

还有一�提�提问质量的方法：让 AI 自己来写问题。这�方法叫做“元提示”(meta-prompting)，听起来有点奇怪——就像让学生自己写考试题一样。但专家说这确实有效。

举例来说，我让 OpenAI 的 ChatGPT 为一个气象学问题编写提示语。你会注意到，在它的示例提示中，它先给自己定义了一个“专家”身份（persona），这�方法称为“给 AI 设定人设”。研究表明，�
��方法能够提�回答质量，并减少错误内容。

我对 ChatGPT 的提示是：

“请为这个问题创建一个元提示：为什么在气温低于冰点时，雨水�然能以液态�落到地面，而�变成雪或冻雨？”

ChatGPT 的回答是：

“你是一�气象学专家。请解释为什么在气温低于冰点的情况下，雨水�能以液态�落地面。要求你的解释简明易懂，面向气象知识相对有限的大众。请尽量使用通俗易懂的语言，并在可能的情
况下举例说明。”

然后我把这个提示�交给 ChatGPT，得到了一份针对低温下�雨现象的通俗易懂且信息丰富的说明。

6. 使用“思维链式”（chain of thought）提示

还有一�指导 AI 的方法是让它在回答问题时分步骤进行逻辑推理。这�方法被称为“思维链式提示”（chain-of-thought prompting），谷歌研究人员发现，它可以让答案更准确。这样做的好处在于，你
能查看 AI 的推理过程，并发现其中的错误。

专家们已经设计了很多�杂的方式去指导“思维链式”推理，比如先给 AI 一个示例，展示它应该如何分解推理步骤。�过，更简�（但可能没那么有效）的方法就是字面上在提示中写道：“使�
�思维链式的方法……”或者“让我们一步步思考如何回答……”等。

7. 让 AI 自己检查答案

还有一�有趣的方式，你可以让 AI 自己验证答案是否准确。这�被称为“链式验证”（chain of verification）的技术，是由 Meta（Facebook �公司）研究人员提出的，研究表明可以减少幻觉。

下面是一段由 PromptHub 公司编写的简化文本，用于指导 AI 自我验证。只需要将下列整段文字�制并粘贴到 AI 聊天机器人里，然后在开头添加你自己的问题�可：

这里是问题：[在此处输入你的问题] 第一步：生成一个回答。第二步：根�这个回答创建并回答一些验证性问题，以检查回答的准确性。请认真思考，确保对问题的回答极其准确。在回答每个�
��证性问题之后，结合这些答案并修正初始回答，得到最终的核实后答案。请确保最终的回答�映了整个验证过程的准确性和结论。

当我用这一格式向 ChatGPT 和谷歌的 Gemini 提问时，它们会先给出一个初步回答，然后列出它们自己提出的验证性问题以及对这些问题的回答，接着�给出修订后的最终回答。

作者简介

Bart Ziegler 曾任《�尔街日报》编辑，可通过 [email protected] 与他联系。

频道推�：经济学人中文版

[0] 经济学人中文版: https://t.me/econo202

2025-01-31T15:59:19+0000

--
Mobot

If you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.

--- SoupGate-Win32 v1.05
* Origin: fsxNet Usenet Gateway (21:1/5)

Who's Online
Recent Visitors
- Rixter
  Thu Jul 30 02:32:09 2026
  from Madison, Nc via Telnet
- Bob Worm
  Wed Jul 29 22:26:45 2026
  from Wales, Uk via Telnet
- Zenobyte
  Wed Jul 29 21:08:05 2026
  from San Juan, Pr via Telnet
- Guest
  Wed Jul 29 14:26:54 2026
  from Balkans via Telnet
- Rixter
  Wed Jul 29 14:18:17 2026
  from Madison, Nc via Telnet
- Rixter
  Wed Jul 29 02:00:40 2026
  from Madison, Nc via Telnet
- Centurion
  Tue Jul 28 22:54:59 2026
  from Berea, Ohio via Telnet
- Bob Worm
  Tue Jul 28 16:01:18 2026
  from Wales, Uk via Telnet

System Info

Sysop:	Keyop
Location:	Huddersfield, West Yorkshire, UK
Users:	741
Nodes:	16 (2 / 14)
Uptime:	81:38:51
Calls:	12,451
Calls today:	1
Files:	15,194
Messages:	6,537,751

=?utf-8?Q?[WSJ]=20#=E4=BA=BA=E5=B7=A5=E6=99=BA=E8=83=BD=20=E5=A6=82=E4=

Who's Online

Recent Visitors

System Info