2025年02月24 星期一 21:22:20

性能比肩OpenAI,“AI界的拼多多”中国DeepSeek爆红

发布时间:2025-01-27 08:44

近年来美国对中国芯片产业的出口管制不断升级,两国科技战如火如荼。中国初创公司深度求索(DeepSeek)近日推出一款廉价计算机大模型,可比肩美国AI(人工智能)公司龙头OpenAI最新模型的超高性能,挑战美国在该领域的霸主之位。由于训练成本远低于同级产品,该模型受到硅谷及多间西方媒体的高度关注,有经济学者质疑美国禁止AI芯片输华无用。

中国下AI子公司“深度求索”公布了新一代开源大模型DeepSeek-R1(下称R1),该模型号称在数学、代码、自然语言推理等任务上,性能可比肩OpenAI最新的o1大模型正式版。在某国外大模型排名榜上,该模型基准测试排名现已升至全类别大模型第3,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型分类中与OpenAI的o1模型并列第一。目前DeepSeek在美区下载热度飙升,在苹果App Store的免费排行榜中排名第4。

Deepseek公司推出全新高性能大模型。

▲Deepseek公司推出全新高性能大模型。

开放代码免费使用

除性能领先外,R1在开源程度上也远超竞争对手o1。 据悉它不仅开放代码,允许任何人免费使用、修改及商业化,还允许用户用它训练自己的模型,彻底打破了以往大型语言模型被少数公司垄断的局面。 Meta AI首席科学家Yann LeCun直言,DeepSeek的成功得益于开放生态,其创新是基于前人成果的持续迭代,显示了开源模型正在超越闭源系统。

由于训练成本极其低廉,该模型也被业界戏称为“AI界的拼多多”。 行业网站 ChinaZ.com 披露,R1研发成本为600万美元,使用了约2000块英伟达生产的专用芯片,而美国大公司的AI系统需使用多达1.6万块芯片。 内媒引述深度求索的技术报告称,R1训练成本是o1的1/30。

这款突破性的开源模型一经面世即引发各界关注。 微软CEO纳德拉指出,DeepSeek的新模型推理计算效率极高,令人印象深刻,“我们应该非常严肃地看待中国AI的发展”。 美媒《纽约时报》也发文称赞,R1以极低成本和少量芯片实现了与OpenAI等巨头相媲美的性能,挑战了“唯有科技巨头才能研发尖端AI”的行业共识。 英媒《金融时报》则称,人们开始质疑AI行业数千亿美元资本支出的效用,投资者甚至认为美股芯片股股价将面临挑战。

近年来美国拜登政府屡次以国家安全为由颁布禁令,限制向中国输送高性能芯片,然而中国公司依然开发出新颖模型。 官媒《经济日报》昨日发文指,DeepSeek的成功证明了大模型创新不一定要依赖最先进的硬件,而是可以靠聪明的工程设计和高效的训练方法。