发布日期:2025-02-17
近期,中国AI初创企业深度求索(DeepSeek)发布的开源模型DeepSeek-R1,以破圈之势在全球范围内爆火,受到了广泛关注。在中美科技战的背景下,社会对我国科技创新的关注达到了前所未有的高度。为深入分析和探讨DeepSeek爆火对中国创新路径的影响及如何借鉴其成功经验,盘古智库于2月12日举办“DeepSeek之爆对中国创新路径的启发”研讨会。现特将会上专家、业内权威人士的观点整理提炼,供大家参考。
一、背景
春节前夕,中国AI初创公司DeepSeek发布的开源模型DeepSeek-R1,以较低的训练成本,达到与OpenAI的顶尖模型o1接近的性能,并实现开源,颠覆了AI行业认知。而这家初创公司脱胎于一家以量化交易为主的对冲基金,公司85后创始人梁文峰成长于“广东一个五线城市”,浙大硕士学历出身,其团队成员均为本土研究人员。
不在外面融资、不是正规的学术机构,幻方量化创始人梁文锋用量化基金的利润,根据自己的爱好,做成了爆火全球的DeepSeek-R1,低成本做出了一个原理接近ChatGPT o1的模型并且开源给了全世界。算力低成本、类o1原理、开源这三个关键点,是它产生巨大反响的原因。
二、DeepSeek的创新点
1. DeepSeek成功地进行了非常系统的再创新。DeepSeek的亮点,按实际价值其实依次是强化学习、混合专家模型MoE、知识与模型蒸馏、多头注意力、多Token预测、混合精度训练和PTX等,排序越往前对模型水准的技术价值越大,排序越往后对成本效率的工程价值越高。实质上准确地讲,这些技术没有一项是DeepSeek自己完全原创,但是DeepSeek成功地进行了非常系统的再创新。再创新也是非常重要的创新角度。不管是强化学习还是MoE架构,在每一个方面DeepSeek都有新的突破,这些系统的再创新,使得DeepSeek模型在推理能力方面大大提升,并实现了降本增效,也让模型能力的展开成为可能。
2. DeepSeek的成功是工程学优化的证明。在目前AI领域几乎很难有从0到1的原创,OpenAI第一个走出来,利用算力、数据、算法作出了智能涌现。DeepSeek则是把每一个环节做到极致,达到了高质量、低成本的效果。它的成功证明了,以工程学的路径达到整个系统优化是完全可行的。
三、DeepSeek产生的影响
1. DeepSeek对人工智能大模型第二阶段的产业发展速度有极大的贡献。OPEN AI 做出了成果却没有告诉大家如何实现,还发了一篇论文说过程性激励和奖励非常重要,把大家都误导了。DeepSeek做了一件事情,它发现极简单:直接给一个结果奖励,最后推理的路径就涌现出来了,它对人工智能大模型第二阶段的产业发展速度有极大的贡献——全世界都被OPEN AI带歪了,而DeepSeek把大家带回来了,这是特别巨大的贡献。
2. DeepSeek引起了美西方对中国创新能力的认识转变,引起了国际资本市场对中国战略性投资的再思考。
3. DeepSeek给中国在科技领域的形象带来了很好的改观。中国在人工智能领域给世界的印象一直是跟随,诸多人工智能重大贡献当中来自中国的较少。这次中国公司以“开源”的形式把最好的东西拿出来,显著提升了中国在人工智能领域的国际形象,展现了中国在科技创新中的主动贡献。
4. DeepSeek给了整个行业很大的信心。DeepSeek的出现,让走向最终AGI的信心被确认了。因为系统效率和质量的提高,单位Token的成本急剧下降,一定会导致智算产业的爆发,“杰文斯悖论”再现。DeepSeek给了整个行业很大的信心,无论是政府、投资人,还是上下游链条。DeepSeek提振了资本市场信心。DeepSeek对于加大一级市场、二级市场对AI 2.0的信心,对后市场、腰部市场、长尾市场的信心非常重要。
5. DeepSeek出圈提振了各方信心。DeepSeek事件超越了一般的技术创新范畴,产生了极大的影响。DeepSeek的出现让我们看到中国企业的竞争力不差,甚至可能是在提高的。政府、企业、百姓等各方的信心都有了提升。
6. 对现在DeepSeek的成绩,可以感到振奋,但是也不要太高估。因为在历史上,作为跟随者、后发者,以更快的速度、更低的成本赶上、甚至某些领域有所超越,这类事情并不少见。对这方面的成绩一方面要高兴,另一方面要保持清醒的头脑。
7. 预计很快DeepSeek就会被无数的创新淹没。如果把DeepSeek爆火这件事放回人工智能2.0发展的时间轴上看,它的影响力可能是有限的,预计很快,这件事在国际上的影响力就会被无数的创新淹没掉了。DeepSeek是开源的,一旦方向指明了就会有人前赴后继。未来几个月的时间里,国际上就会有多款产品超过它,国内也是。
8. 三个“没有变”使我们在思维上不能过于乐观。第一,AI发展的大方向没有变。我们预计在“十五五”末期会看到AGI的更多成果,今天DeepSeek在这个领域取得的成绩只是我们在人工智能发展长河当中的一步。第二,中美战略竞争的位置并没有根本转变,我们仍然处在主流跟随、局部突破的位置。第三,人工智能创新发展的底层逻辑没有变,就是算力、算法、数据。这三个“没有变”使得我们在思维上不能过于乐观。长远看,包括如何突破算力的芯片,如何突破云计算算力服务的普惠性,依然有很多的工作需要做。
9. DeepSeek带来了对于创新进行多角度思考的气象。DeepSeek让人们对于中国什么样的地方、什么样的体系有可能出现创新有了多角度的思考。DeepSeek事件在中国企业创新思想上,可能带来“文艺复兴”的影响力,最近出现了各个角度的探索、分析,的确有这样的气象。
四、关于目前及后续的一些判断
1. 现在是一个生态涌现时刻,是中国AI 2.0产业市场开始起飞的状态。从生态涌现角度讲,AI大模型会出现一个体量庞大的后市场,大家会用开源模型包括基于闭源模型的API做许许多多的事情,每个开源模型会有成千上万个分身,各个方面的开发者都会利用这种能力。总体来讲,现在是一个生态涌现时刻,是中国AI 2.0产业市场开始起飞的状态。
2. 各行各业都将做出顶尖的成果,世界将发生巨大的改变。DeepSeek只是我们走向AGI的高峰之一,不是终极的喜马拉雅山,很快会出现更多的“DeepSeek”。按照目前的方法论和工程学的优化,很多企业也能做出DeepSeek-R1甚至比R1更好的版本。甚至,大家用它的方法论或者工程学,可以在模型、基础设施、芯片、软件等各行各业都做出顶尖的成果,这个时候世界就将发生巨大的改变。
五、关于目前及后续的一些判断
(一)城市发展
1. 有专家认为,DeepSeek的成功与城市无关。关于“哪个城市更适合于创新”这个话题,DeepSeek这件事跟这些没有关系——DeepSeek大部分的人是在北京招的,梁文锋在杭州。DeepSeek对城市、地点这个话题没有任何启发,没有必要花太多时间在地点上。城市应该多思考自己有什么特长,而不是希望重复另外城市的成功经验。
2. 也有专家认为,DeepSeek和《哪吒2》的成功与城市环境高度相关。从城市发展的角度来看,最近爆火的DeepSeek和《哪吒2》背后的成都和杭州两个城市有比较类似的特点,一是有很多小微企业,二是亲近小微。这两个地方产生两个震惊中国和世界的成绩不是偶然的。这两座城市都有类似的注重生态、亲近小微和柔性治理的特点,这可能对我们未来的创新路径和政府在其中应该扮演什么角色有很大的借鉴意义。此外,无论是可可豆还是阿里,从创新到引起关注都走过了差不多10年的历程,提示我们要有耐心培养环境。
3. DeepSeek这件事引发了一些地方政府的反思,以某城市为例。该城市原来的创新资金投入更多的是和硬件、供应链结合在一起,纯软件方向根本无人支持。原来更多的把钱投在高校和科研机构,以后可能要分出一部钱给中小企业,让土壤更加肥厚,让更多的小草长大。政府开始注重个性化服务,特别成立了AI的专班,正在研究推出新的政策。
4. 各城市要避免在“比较”中的过度投资。DeepSeek的出现引发了广泛讨论,各地纷纷相互“比较”,探讨如何培育类似企业。在此过程中,应避免重蹈覆辙:过去国家主导某些产业政策时,部分城市盲目跟风,导致过度投资和产能过剩,最终依赖低价竞争,损害行业和自身利益。导致我们在许多领域虽有顶尖技术,却未能实现盈利,如光伏和电动汽车。若不改变这种模式,未来新领域的突破也可能陷入同样困境。
5. 不要迷信DeepSeek。AI产业每天都有让人眼前一亮的进展。DeepSeek的成功是昙花一现还是“哪吒问世”依然需要时间来验证。过早总结和固化DeepSeek的发展模式,并按照这个模式制定监管规则、产业政策,或是投入公共资金遴选、资助特定项目或是公司都将是短视和狭视的行为。
(二)政策与监管
1. 把握好政府的角色。在不同产业和不同发展阶段,政府与市场所扮演的角色是不太一样的。以芯片和AI为例,在芯片领域,我们目前处于明显的追赶阶段,且这一领域的主要挑战并非来自科学理论,而是工程实践中的经验积累。因此,在这一领域,政府的作用较为重要。相比之下,在AI等前沿颠覆性创新领域,政府应更多地扮演“园丁”的角色,专注于营造良好的市场环境,让创新自然生长。特别是80后、90后和00后,他们往往能够基于兴趣和理想进行创新研究,未来的颠覆性创新有望在这一群体中不断涌现。
2. 营造更好的创新环境,政府要做好服务,减少不必要的干预。创新的涌现依赖于良好的生态,政府对创新企业最好的支持是在合法前提下减少干预。对初创企业应避免过度监管和大量补贴,容忍类似“千团大战”的竞争“乱”象,自然竞争有助于市场自我规范。提供包容审慎的监管环境,让企业在健康生态中成长,而非拔苗助长。
3. 创新点需要慢慢培养。依靠兴趣驱动的项目更容易百花齐放、孕育创新点。这些点滴积累为国家实现原创性突破、尤其是从0到1的创新至关重要。它们可以逐步成长,借助创投和企业力量,最终形成具有前沿性和原创性的成果。
4. 要重视企业的主体地位。当前企业的主体地位越来越明显但政策尚未配套,科研经费和科技力量如何向企业转移仍需机制支持。尽管高校、院所和国家实验室成果显著,但如何赋能企业仍是短板。此外,国企与民企的定位与合作也需进一步明确,以充分发挥各自优势。
5. 当前形势对创投提出了更高要求,其能否跟上并发挥作用至关重要。以欧盟为例,其报告指出,欧盟缺乏足够创投,导致30%在本土创立的独角兽企业赴美融资并最终成为美国公司。国内类似情况也对创投提出了挑战,尤其是美元资本回流后创投能否填补空缺成为关键问题。此外,目前创投资金主要依赖国有资本,如何在道德风险与不确定性中取得平衡仍未解决,这可能是未来的一大隐忧。
6. 坚持开放。我们要坚持开放,我国科技取得今天的成就是因为开放,未来的发展也要开放。要站在世界舞台,汇聚全人类的成果。DeepSeek用的是英伟达的芯片和最前沿的、世界通用的Transformer架构以及中国的优秀人才,才有这个结果,也是因为开源得到了世界的认可。
7. 不能把创新的视野局限在眼下的大模型或者其他与此相近的一些创新上。面向AI未来的发展,要打开思路。面向未来,不排除还有其他的模型和其他的路径。创新的环境要宽泛宽松,当取得目前成绩的时候,千万不要把我们的视野只局限在当下的大语言模型、DeepSeek等等,要注重各种其他的创新,千万不要把视野锁定了。
(三)行业与企业
1. 内卷会影响创新,反内卷特别重要。在DeepSeek的API涨价200%-500%区间时,很多云商实施大幅度降价。这种“你涨价我降价”的现象,可以称之为AI大模型的内卷以及反内卷。AI大模型领域比任何其他领域都更需要反内卷,如果大家都没有钱挣,就变成了少数人的游戏,创新的玩家没有造血功能就难以持续、逐渐退出,行业只剩下少数玩家,这会极大妨碍整个创新的进程。我们要警惕高度内卷文化带来创新成本过高的问题,要警惕“蝗虫过境寸草不生”的思路,要反内卷。
2. 不要迷信大厂,中小型企业是创新主力。无论是DeepSeek,还是openAI,都不是大厂。事实上,今天的移动互联网万人大厂,绝大多数(除了微软)也不是更早的互联网大厂。科技产业的颠覆性创新已经多次证明,DeepSeek再次证明,AI产业中,中小型企业是是创新主力。
(四)创新文化
1. 我们不缺钱,不缺技术,也不缺高密度的人才,但是缺包容创新的文化。我们的文化当中要给“非共识”一些土壤,从机制上保证,资源上保证,文化上保证。DeepSeek这件事给中国创新路径一个最大的启发,是社会和各级组织要包容那些非共识、非主流、非中庸的人,不光是个人的包容,要变成机制的包容、文化的包容。所有的创新都是对原来领域权威和规则的否定,有时候越前沿的东西越是非共识的,越不是中庸的。“高质量的中庸”就是要包容他们——不是无原则的大力支持,而是包容,给他足够的空间,中国的文化当中特别需要“高质量的中庸”。在主赛道之外留一块自留地给那些“非主流”的人,给他们自由生长的空间。
(五)人才与教育
1. 要认识到我国的人才与教育是有优势的。中国人才基础庞大,80、90后出生人口最密集,按比例,人才的绝对数量很大。我国人才培养模式也有良好的基础。目前的北大、清华、浙大等更多更好的学校,包括这几年国家在教育改革上成立了一些人工智能学院等等,对加速推进在前沿领域的改革创新和落地是非常重要的。据一位专家亲身调研观察,硅谷有两个现象:一是大厂中华人工程师不低于30%,二是如果初创公司中华人工程师低于30%则表明该公司实力并非特别突出。可见中国的教育体系是有优势的,培养工程师的制度碾压世界其他国家。
(六)其他
1. 在创新中,情怀与爱好力量巨大。梁文锋是根据兴趣爱好去做的。他不去做产品,不为了做大公司去融资。他想要做的就是怎么能在 AGI上有突破。因为他本身的动因是情怀,因此他能够将DeepSeek开源,形成如此巨大的影响力。否则的话,DeepSeek就是另外一个模型。
2. 理想的研究环境与激励模式。DeepSeek的研究环境有三个关键要素:足够的资源、足够好的工资、足够聚焦——找一些足够好的人,聚焦在一件事情上,做一段时间。OPEN AI在发布ChatGPT之前就是这种状态。幻方在DeepSeek发布之前也是这种状态。且中小企业有一定的模式优势。DeepSeek核心人员可以分享产品商业化过程中一定比例的收益,科学家非常年轻,但对科研自主权的掌握度非常高,所以某种意义上是一种使命驱动、但又有很高回报的激励模式。
3. 匮乏有时候反而是财富。正是因为算力的匮乏,倒逼DeepSeek做汇编语言方面的编程,做出一系列的创新,最终取得了很好的效果。就像以色列,以色列资源极度匮乏,但反而极度创新,这是值得国内目前处于弱势地位的行业和机构思考的。
(七)对创新方向的启示
1. 场景驱动创新。DeepSeek的成功在于其高度优化的场景方法论,通过MoE架构和精细的系统设计,实现了工程学的涌现。其奖励模型基于真实数据和环境反馈,而非传统数据标注,差异显著。同时,DeepSeek通过抓场景让千行百业找到可结合、可部署的应用场景,这是其破圈的关键。
2. 体验驱动创新。DeepSeek的成功源于产品体验形成的竞争壁垒,尽管存在幻觉问题,但其低门槛和快速提升的结构化输出能力支持了广泛的应用场景。DeepSeek才刚刚起步,未来将涌现更多AI+应用。体验驱动不仅是DeepSeek的启示,也是2025年AI应用创业和产品创新的重要方向。
3. 知识驱动创新。无论是什么行业,都有独有的知识库——从个人知识库到企业知识库。迅速进入到细分场景和领域,迅速进入到千行百业的知识库,去创造独有的小场景、小模型和应用,成为更加生生不息的创新生态,也是重要的创新方向。
(感谢陈晓晖、邓永强 、葛颀 、胡延平 、李志龙 、梁春晓、刘淼、梅德文、孟祥武、秦朔、盛希泰、吴声、夏春、邢杰、熊园、熊智辉、易鹏、张备、张宏江、张旭、张中祥等提供主要观点。)
盘古智库课题组
2025.02.16
报道网站:盘古智库