• =?utf-8?Q?[WSJ]=20#=E4=BA=BA=E5=B7=A5=E6=99=BA=E8=83=BD=20=E5=A6=82=E4=

    From Mobot@21:1/5 to All on Thu Jan 30 01:12:18 2025
    XPost: alt.chinese.text

    如何凭借�费软件策略让 DeepSeek 一举跻身 AI 明星行列

    DeepSeek 将其技术开源的目的之一可能只是为了最大限度地提高其知�度。图片:joel saget/Agence France-Presse/Getty Images

    作者:Belle Lin

    翻译:ChatGPT o1

    阅读时长约 5-6 分钟

    DeepSeek 这家中国人工智能公司,凭借其全新 AI 模型在硅谷掀起轰动,而其成功部分归功于一个由来已久的策略:�费开放其技术。

    这�被称为开源(open-source)的方法,让公司可以�费发布技术,供公众使用、共享和修改。长期以来,这被视为新兴公司用来打破大型、闭源竞争对手垄断地�的一�常见手段。那些�愿意��
    ��分享技术的大公司,往往更倾向于封闭式开发。

    在本例中,DeepSeek 正面挑战的是 ChatGPT 聊天机器人背后的公司 OpenAI。根�一些分析师的估计,OpenAI 在全球生成式 AI 市场中��了 80% 的份额。DeepSeek 表示,其模型在解决问题方面表现出色,与
    OpenAI 的 o1 推理模型�相上下,但每次使用的成本�只有后者的一小部分。

    并非只有 DeepSeek 在利用开源策略挑战 OpenAI。其他一些 AI 初创企业(如 Mistral AI、Hugging Face、Runway AI 和 Together AI)也同样选择了开源方式发布其技术。大型科技公司也在这样做:Meta Platforms 于
    2023 年开源了其 Llama 模型,谷歌去年也发布了�为 Gemma 的开源模型。

    �过,DeepSeek 的 R1 模型是否真正符合标准的开源软件定义,在业内�有争议。市场研究和 IT 咨询公司 Gartner 专门研究 AI 的分析师 Arun Chandrasekaran 指出,DeepSeek 虽然公开了其 R1 模型的“权�”�
    ��模型的数值参数),供大众�费使用、下载和修改,但并未公布背后的训练数�。美国的 Meta 也采取了类似的做法,��然称其模型为“开源”。

    然而,�费意味着开源技术能够迅速吸引大批对新技术感兴趣的开发者�来尝试。通过这�方式,它们构建了一个所谓的“生态系统”,让工程师们基于这些技术开发自己的版本,助推其影�力
    远远超越原始研发者的设计范围。

    提供开源模型分享平台的初创企业 Hugging Face 表示,其社区已经基于 DeepSeek 的 R1 模型创建了 617 个�生模型,总下载量超过 300 万次。

    “在人工智能的发展中,开放会带动各个方面的进步。”密歇根大学机器人学教授 Jason Corso 表示,“他们为更广泛的 AI 社区提供了研究和验证其方法论的机会,并能将其�入各自的工作中。”

    如果 DeepSeek 的新 R1 模型是专有的或者需要付费使用,那么独立开发者就�太可能花力气来构建并分享他们对该技术的改进。如今,谁能赢得开发者的青睐,谁就更有可能在 AI 领域站稳脚跟,尤
    其是在 OpenAI 和 Anthropic 等 AI 公司还在激烈争夺工程师为其技术平台开发应用之际。

    那些基于开源技术打造产品的初创公司,也更有可能采用像 DeepSeek 这样功能强大且成本更低的模型,从而帮助将这家中国公司的 AI 模型嵌入到面向消费者和企业的各类新产品和�务中。

    美国企业也纷纷对此表现出浓厚兴趣。一些企业技术主管表示,他们希望这能让所有人的 AI 成本都随之下�。

    “到这个月底还会出现另一个‘DeepSeek’,今年在美国和全世界都会涌现出更多类似的公司。”非营利组织 Linux 基金会(Linux Foundation)的执行董事 Jim Zemlin 表示,该基金会主要支持开源技术的�
    �展。

    公司之所以会对技术进行封闭,一大原因是想阻止竞争对手获得它。但实际上,�便技术�公开,也很难阻止它被传播。OpenAI 周三表示,他们正在调查 DeepSeek 是否通过多次查询 OpenAI 的模型来�
    �练自己新的聊天机器人。

    毫无疑问,开源策略也存在风险。并�能保证�费技术一定能赚钱,因此一些公司会在自己的开源模型之上,出售面向企业的高级�务或应用。还有一些公司�费提供功能较弱的模型,最强大的
    则收费。

    对于企业来说,开源技术可能是一面“警示旗帜”,因为它们对将未经验证的技术引入公司内部�分谨慎。专家指出,开源让攻击者更容易找到并利用潜在的网络安全漏洞,但开源也能带来更高
    的定制化和可控性。

    “开源权�的模型缺乏内置的安全认证,合规风险完全落在部署该技术的组织身上。”专注金�科技与咨询的 Synechron 公司全球 AI 主管 Ryan Cox 表示。

    �过,对于 DeepSeek 来说,其目标或许只是尽最大程度地扩大知�度,并向美国的 AI 巨头证明自己能开发出一款功能强大且成本更低的技术。

    “他们意识到自己手上有一个非常强大的模型,于是说:‘机会来了,让它快速火起来吧。’”Gartner 的 Chandrasekaran 表示,“而让它快速火起来的方式之一,就是把它做成开源。”

    如需联系本文作者 Belle Lin,请发邮件至:[email protected]

    频道推�:经济学人中文版





    2025-01-30T01:11:35+0000

    --
    Mobot

    If you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Mobot@21:1/5 to All on Fri Jan 31 16:55:13 2025
    XPost: alt.chinese.text

    如何减少 AI 聊天机器人出现幻觉

    Illustration: Adrià Voltà

    作者:Bart Ziegler

    翻译:ChatGPT o1

    阅读时长:约 8 - 10 分钟

    你无法完全阻止 AI 聊天机器人偶尔出现“幻觉”——�对提示给出误导性或错误答案,甚至凭空�造信息。然而,你可以采取一些措施,尽量减少它在回应你的请求时给出错误信息的几率。

    波士顿咨询集团 (Boston Consulting Group) 下属部门 BCG X 的首席技术官 Matt Kropp 表示,AI 之所以会出现“幻觉”,有以下几个原因:其一,是用于训练 AI 聊天机器人的数�中关于你所询问主题的信息�
    ��身就存在冲突、�正确或�完整的情况。对此,你无能为力。其二,则是“你没有明确说明你想要什么,”Kropp 说——而这一点是你可以改进的。

    下面是专家们给出的一些技巧,可帮助你最大程度地减少(但无法彻底杜绝)AI 产生的虚假信息。

    1. 给 AI 提供详细的指令

    告诉 AI 你想要的确切内容。如果你的提示过于宽泛,让它在自己的数�库中随意“翻找”,更有可能生成错误或虚假的信息。

    “你需要使用详尽的指示,使用精确的语言,但也要确保提示简洁并与问题直接相关,”技术咨询公司 Gartner 的分析师 Darin Stewart 说。

    我最近在选购汽车时,向一个 AI 聊天机器人寻求帮助。它为我提供了非常有用的对比信息,涵盖我感兴趣的 SUV 的尺寸、价格和�置。但其中有一款车的油耗(MPG 值)似乎高得离谱。深入调查�
    �,我发现它给出的其实是柴油版车型的油耗——而那款柴油车型并未在美国销售。

    另一个 AI 给我介�了一款 SUV 的某些特性,但与我在汽车制造商官网上看到的信息并�相符——原来该聊天机器人引用的是几年�的旧款车型�置,而非 2025 款。

    要避�这些错误,我本该告诉这些 AI:我只想要美国市场上销售、且是当�在售车型的相关信息。

    2. 分步骤结构化你的提问

    专家建议,你应该将提问结构成若干个简明的直接问题,而�是一次性抛出一个开放式的大问题。可以一个接一个地提出这些问题——这一过程被称为“迭代式提示”(iterative prompting)。这样�
    �能�低 AI 生成错误信息的概率,也能得到更有用的结果。

    “我与 AI 模型的互动,�是一次提问、一次回答的关系,而更像是一场对话,”Kropp 说。“你在�断构建上下文。”

    如果你想买一台新洗碗机,�要只问“我应该买哪款洗碗机”,而可以先这样提问:“我需要一台新的洗碗机。选购时有哪些主要功能需要考虑?”

    在 AI 回答之后,你可以继续问:“哪些品牌以可靠性著称?哪些又应该避�?我该花多少钱?高价机型值得额外投入吗?”

    为了进一步指导 AI,你还可以让它按某�固定的结构来回答,比如:

    “请按以下结构来回答:先给一个概述,然后列出关键发现,�列出�同机型的优缺点,最后得出结论。请确保为每一个发现提供支撑证�。”

    当我用这�提示向 AI 提问时,它生成了一份约 500 字的综合分析,告诉我该考虑哪些洗碗机、该避开哪些。就我所见,它并没有编造内容。

    3. 指导 AI 使用可信来源

    告诉 AI 使用某些类型的来源,可能会让它避�引用那些质量可疑、有偏见或错误的信息。

    在我搜寻汽车信息的过程中,AI 有时会列出一些来自汽车爱好者网站或 Reddit 上匿�用户帖子的信息作为参考。这些帖子里有些内容看起来并�专业,或者带有误导性,或是过于吹�。

    除了来源本身的质量外,AI 列出的引用也�一定可靠。专家表示,AI 给出的引用并�代表它的回答确实直接源自这些引用。实际上,AI 往往并�知道自己答案中的具体内容是来自哪里。此外,AI
    也曾被发现引用并�存在的文件、研究或其他来源。

    我��了之�的问题,但这次告诉 AI 只去看专业评测,并点�了我希望它参考的一些来源,例如《消费者报告》(Consumer Reports)、《Car and Driver》杂志以及汽车购物网站 Edmunds。我无法确认它是��
    ��确实用了这些来源——专家告诉我,我列出的来源可能会让 AI 倾向于选择类似但并�完全相同的材料。�过,它给出的答案确实更有参考价值,也几乎没有多少可疑的信息了。

    约翰斯·�普金斯大学的研究人员发现了一�方法,可以让 AI 直接从其数�库中使用特定来源。只需在问题开头使用“According to Wikipedia(根�维基百科)”这样的话语,或者针对医疗健康问题�
    �用“According to PubMed(基于 PubMed 数�)”,就能让 AI 直接引用这些来源,研究人员在报告中指出了这一点。

    4. 告诉 AI �要编造

    这听起来有点像老师警告顽皮学生“别作弊”,但有些专家认为,你应该明确告诉聊天机器人:“如果�确定就说�知道”或“�要凭空�造答案”。这样,也许可以让它在数�库中证��足时
    ,�要随便编造信息应付。

    “你实际上是在给它一个‘许可’,让它去做一件原本没有经过专门训练的事——承认‘我错了’或‘我�知道’,”Kropp 说。

    5. 使用“元提示”(meta-prompt)来指导 AI

    还有一�提�提问质量的方法:让 AI 自己来写问题。这�方法叫做“元提示”(meta-prompting),听起来有点奇怪——就像让学生自己写考试题一样。但专家说这确实有效。

    举例来说,我让 OpenAI 的 ChatGPT 为一个气象学问题编写提示语。你会注意到,在它的示例提示中,它先给自己定义了一个“专家”身份(persona),这�方法称为“给 AI 设定人设”。研究表明,�
    ��方法能够提�回答质量,并减少错误内容。

    我对 ChatGPT 的提示是:

    “请为这个问题创建一个元提示:为什么在气温低于冰点时,雨水�然能以液态�落到地面,而�变成雪或冻雨?”

    ChatGPT 的回答是:

    “你是一�气象学专家。请解释为什么在气温低于冰点的情况下,雨水�能以液态�落地面。要求你的解释简明易懂,面向气象知识相对有限的大众。请尽量使用通俗易懂的语言,并在可能的情
    况下举例说明。”

    然后我把这个提示�交给 ChatGPT,得到了一份针对低温下�雨现象的通俗易懂且信息丰富的说明。

    6. 使用“思维链式”(chain of thought)提示

    还有一�指导 AI 的方法是让它在回答问题时分步骤进行逻辑推理。这�方法被称为“思维链式提示”(chain-of-thought prompting),谷歌研究人员发现,它可以让答案更准确。这样做的好处在于,你
    能查看 AI 的推理过程,并发现其中的错误。

    专家们已经设计了很多�杂的方式去指导“思维链式”推理,比如先给 AI 一个示例,展示它应该如何分解推理步骤。�过,更简�(但可能没那么有效)的方法就是字面上在提示中写道:“使�
    �思维链式的方法……”或者“让我们一步步思考如何回答……”等。

    7. 让 AI 自己检查答案

    还有一�有趣的方式,你可以让 AI 自己验证答案是否准确。这�被称为“链式验证”(chain of verification)的技术,是由 Meta(Facebook �公司)研究人员提出的,研究表明可以减少幻觉。

    下面是一段由 PromptHub 公司编写的简化文本,用于指导 AI 自我验证。只需要将下列整段文字�制并粘贴到 AI 聊天机器人里,然后在开头添加你自己的问题�可:

    这里是问题:[在此处输入你的问题] 第一步:生成一个回答。 第二步:根�这个回答创建并回答一些验证性问题,以检查回答的准确性。请认真思考,确保对问题的回答极其准确。 在回答每个�
    ��证性问题之后,结合这些答案并修正初始回答,得到最终的核实后答案。请确保最终的回答�映了整个验证过程的准确性和结论。

    当我用这一格式向 ChatGPT 和谷歌的 Gemini 提问时,它们会先给出一个初步回答,然后列出它们自己提出的验证性问题以及对这些问题的回答,接着�给出修订后的最终回答。

    作者简介

    Bart Ziegler 曾任《�尔街日报》编辑,可通过 [email protected] 与他联系。

    频道推�:经济学人中文版

    [0] 经济学人中文版: https://t.me/econo202




    2025-01-31T15:59:19+0000

    --
    Mobot

    If you have any comments on this article, feel free to reply to this post. However, for feedback on the bot, please post in the cn.fan group.

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)