国产人工智能大模型DeepSeek的火爆给市场带来持久振奋,与此同时“赢麻了”、“DeepSeek羞辱OpenAI”等情绪化说辞也不胫而走。 官媒昨日发文指出,这类“速胜论”值得警惕,称DeepSeek只是实现了算法创新驱动的效率革命,没彻底改变全球AI发展格局,该领域中国仍处于追赶状态,在基础研究和算力等核心技术上与美国仍有差距。
▲官媒坦言,DeepSeek仍是在英伟达芯片集群上训练而成。
今年初杭州人工智能公司DeepSeek发布同名最新大模型,给全球AI界扔下一枚科技核弹。 似乎一夜间,DeepSeek凭其强大的逻辑推理能力和语言能力、开发成本低廉等特点火爆全网,一度碾压ChatGPT、 Google Gemini等其他顶尖AI软件登顶中美App Store免费榜。
仅实现算法创新驱动效率革命
《北京日报》报业集团旗下新媒体“长安街知事”发长文写道,DeepSeek的火爆给市场带来持久振奋。 不过与之同时,“赢麻了”“DeepSeek羞辱OpenAI”“AGI实现了”“已超越美国”等情绪化说法不胫而走,背后的速胜论思维很值得警惕。
业界普遍认为,数据、算力、算法是人工智能发展的基础三要素。 文章指出,从技术角度看DeepSeek打破了“高算力和高投入是发展人工智能唯一途径”的迷信,然而“算力不足,算法来补”的成功并不意味着算力就不重要了。
文章坦言,DeepSeek仍是在英伟达芯片集群上训练而成,没有绕开英伟达CUDA程序设计框架。 英伟达依托后者构建的软件生态,被认为是比芯片更高的技术护城河。 目前“DeepSeek+国产GPU(图形处理器)”的新闻频出,不过真正能满血高效运行的恐怕不多。
真正能满血高效运行不多
文章指出,随着人类用于训练AI的数据消耗殆尽,AI大模型将从“训练时代”进化到“推理时代”,这无疑对芯片性能提出更高要求。 因此万万不能因DeepSeek的成功就认为毋须再弥补算力上的差距,相反更应在国产芯片替代与软件生态构建方面有更强紧逼感。 DeepSeek的出现并未彻底改变全球人工智能发展格局,我国总体仍处于追赶状态,在基础研究和核心技术上与美国仍然有差距。