DeepSeek新模型因使用华为芯片难产？
时间:2025-08-18 13:24来源：未知点击: 次

中国人工智能公司 DeepSeek 因使用华为昇腾系列芯片进行训练受挫而推迟了其第二代模型的发布，凸显了中国政府力推取代美国技术的局限性。

《金融时报》报道引述据三位知情人士透露，DeepSeek 在 1 月份发布其 R1模型后，受到当局的鼓励，采用华为，而不是使用英伟达的处理器。但知情人士表示，这家中国初创公司在使用华为昇腾系列Ascend 芯片进行 R2 模型训练的过程中遇到了持续的技术问题，促使其使用英伟达芯片进行训练，使用华为芯片进行推理。

一位知情人士表示，这些问题是该模型发布日期从 5 月推迟的主要原因，导致其落后于竞争对手。

训练是指模型从大型数据集中学习，而推理是指使用训练好的模型进行预测或生成响应(例如聊天机器人的查询)的步骤。

《金融时报》分析指出，DeepSeek 的困境表明，中国芯片在关键任务上仍落后于美国竞争对手，凸显了中国在技术自给自足方面面临的挑战。

有报道称，中国政府已要求中国科技公司解释其订购英伟达H20芯片的合理性，以鼓励它们推广华为和寒武纪的替代产品。业内人士表示，与英伟达的产品相比，中国芯片存在稳定性问题、芯片间连接速度较慢以及软件质量较差等问题。

据两位知情人士透露，华为派了一个工程师团队前往 DeepSeek 的办公室，帮助该公司使用其 AI 芯片开发 R2 模型。然而，尽管团队在现场，DeepSeek 仍无法在昇腾芯片上成功进行训练。

知情人士表示，DeepSeek仍在与华为合作，以使该模型与昇腾芯片兼容进行推理。

DeepSeek创始人梁文锋内部曾表示，他对R2的进展不满意，并一直在努力投入更多时间构建更先进的模型，以保持公司在人工智能领域的领先地位。

另一位知情人士补充说，R2 的发布也因更新模型的数据标注时间长于预期而被推迟。中国媒体报道称，该模型最早可能在未来几周内发布。

图为 2025 年 1 月 27 日拍摄的 Nvidia 和 DeepSeek 徽标。

图为 2025 年 1 月 27 日拍摄的 Nvidia 和 DeepSeek 徽标。 REUTERS - Dado Ruvic

作为中美地缘政治斗争中心的芯片制造商，英伟达最近同意向美国政府提供其在华收入的一部分，以恢复其 H20 芯片在中国的销售。英伟达在谈到使用其芯片的中国企业时表示：“开发者将在构建制胜的人工智能生态系统中发挥关键作用。放弃整个市场和开发者只会损害美国的经济和国家安全。”

DeepSeek 和华为尚未回应置评请求。

责任编辑:admin

织梦二维码生成器

顶一下

(0)

踩一下

(0)

免责声明：中国民生播报网本栏目发布信息，目的在于传播更多信息，丰富网络文化，稿件仅代表作者个人观点，与中国民生播报网无关。其原创性以及中文陈述文字和文字内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本网不做任何保证或者承诺，请读者仅作参考，并请自行核实相关内容。凡注明为其他媒体来源的信息，均为转载自其他媒体，转载并不代表本网赞同其观点，也不代表本网对其真实性负责。您若对该稿件由任何怀疑或质疑，请即中国民生播报网联系，本网将迅速给您回应并做处理。