Web3 天空之城 · 城主:
春节除夕到来之际,DeepSeek 黑天鹅在美股放了个大炮仗,把美国人震得晕头转向。周一英伟达创下了史上最大跌幅,一夜跌去 17% 约 4650 亿美金。整个纳斯达克大盘跌去了近两万亿美金,纳斯达克指数下滑了 3%。
城主在 DeepSeek R1 刚出来之际,写了一篇文章《硅谷 AI 霸权和神话的破灭开端:浅谈 DeepSeek R1 的意义》, 目前看来,现实的进展比预期更快,酝酿了几天后,恍然大悟的金融资本如海啸一般吞噬了瑟瑟发抖的纳斯达克科技股。
有老外在 X 平台发推,评论 DeepSeek 用 650 万美金蒸发了美国 2 万亿市值。这绝对是人类历史留名的一刻。(不尽准确,650 万只是 v3 模型的宣称费用,不包括 R1)
有趣的是,DeepSeek 母公司"幻方量化"就是玩金融的。这宿命的金融收割啊。坊间传闻,幻方有一个做空 NVidia 的模型,还有一个笑话是,幻方以后发布自己的 AI 大模型就是做空 NV 的最好手段。
本来城主对这些传闻都是一笑而过的,但就在除夕前夜,美科技股因为 DeepSeek R1 而经历史诗级大跌的同时, 幻方创始人梁文锋又又又发布了 DeepSeek 最新的多模态模型。先不说其中创新的大模型框架,只看其中 AI 生图技术,在评测中直接击败了 OpenAI DALL-E 3 和 Stable Diffusion。
这节奏真妥妥的;又想到 R1 发布的时间正是懂王上台的同一天 …… 这大棋论,都快由不得城主不信了。
在这个历史性时刻(还是中国人的新春佳节),值得好好说道。
昨夜美国注定很多人无眠,英伟达股票破天荒的跌穿 20%,最后停在 17% 跌幅,台积电跌了 13%,芯片指数大跌 9%,和半导体芯片相关的股票都在跌。
美国的主流新闻舆论已把这个时刻和当年苏联首发人造卫星的时刻相提并论。或许多年以后,他们还会想起这一刻被 DeepSeek 全控的心理阴影。
城主上一篇文章发出后,评论区留言有一种论调是:DeepSeek 把技术开源了,所以老美可以复制技术了 ,然后老美还有更好的算力,所以老美继续保持领先 ……
但是,如果真相和未来就是这么简单, 昨天的纳斯达克就不会血流成河,跌去两万亿市值。金融的嗅觉一直是最敏感的,尽管有时候过度了。
这几天真的很热闹,看到投资圈的人一直在深挖 DeepSeek 的内幕后台意义。但说一句不知道是否正确的话,搞金融投资的同学,大多情况下只有当一个事情成为香馍馍时,才使劲去挖掘意义。在 DeepSeek 爆火之前,采访这个团队和创始人的文章只有寥寥一二;而现在,那一两篇难得的采访,都被翻出来当作重要资料反复研读,甚至被翻译为英文后老外也在逐字研读。
所有人都在谈 DeepSeek,各种角度,各种方向。城主简单说几个判断吧。
第一,DeepSeek R1 为什么开源?除了创始人的格局,还有一个因素是,让 AI 自动强化学习的思路从下围棋的 AlphaGo Zero 就已经存在。这个直接强化的训练方式从逻辑上是非常直接的,即使 DeepSeek 不发,其他 AI 团队早晚也会发现。所以还不如自己先发出来,同时发布自己的大模型,两者结合,产生最大的影响力。(开源这一点后面还会展开谈谈)
第二,DeepSeek 的核心竞争力除了论文上的原创大模型强化训练方法,同样重要的是它们的工程架构实践,这一点在 Perplexity 创始人的评论里就有体现。
大家都知道 DeepSeek R1 是个 MOE 专家模型,但专家模型的训练很难把握参数的平衡和训练程度。简单地说就是多个专家模型如何能在训练中同时达到最好水平,用什么样的方式来进行这个判断。另外,DeepSeek 成功把 8 位浮点精度运用在大模型训练和推理中,所有人都知道这样能大幅度降低硬件要求,但怎么做到这点,这就不容易了。更加不用说, DeepSeek 的工程架构依托在幻方这个量化交易巨头多年的实践积累之上。所有这些,都非一日之功。
第三, 开源醉翁之意不在酒,在于技术平权和打破封锁。
首先技术平权就是开源的重要特点。不像封闭的 OpenAI,DeepSeek 大概想通了一点,作为一种工程技术, 大模型的训练秘密是难以一直保密的。
本质上,人类对 Transformer 模型本身为什么能产生如此惊人的智能能力毫无所知,只知其然,不知其所以然。
如果未来,某个学术团队真正揭开了 Transformer 模型让计算机产生智能响应的秘密,这或许是一个类比其他自然科学保密研究的成果。
但在此之前,对大模型训练的方法迭代,本质上只是某种工程的尝试和优化。强化学习技术不是新鲜事物,这只是一层纸。
西方团队没能第一个找到和突破这层纸,还是因为 GPU 硬件太容易得到了。人是有惰性的,没有一个外界的动力,往往就被自己带偏了。
但这层纸突破后,让所有人都明白怎么打造一个顶级 AI 智能,相当于教科书发给了所有学生,剩下的,就看谁能学习考试拿第一(工程实践出结果)。而这一点,难道不是中国人的拿手好戏吗?
最后,如果能通过 AI 技术平权,直接给予美国芯片锁死中国的政策致命一击(从周一纳斯达克的表现,已经初见成效),那么,这对中国而言,依然是个意外的巨大胜利。
什么,你还要问开源了赚钱怎么办?有人觉得幻方还差钱吗?
可以客观地说,做 AI 服务是很难赚到大钱的,更何况 DeepSeek 做的是 AI 开源。
幻方在 API 服务上的策略是只要在收回成本之上稍有盈利即可。
有很多老美都在打问号:DeepSeek 这么开源的搞法,怎么赚钱呢?答案是幻方根本没打算从 DeepSeek 中赚钱。
注意,这里的前提是,母公司幻方作为量化巨头,实实在在地给了创始人梁文锋"打平即可"的底气。
这是背负几千亿估值,不惜和马斯克打官司也要把自己变成盈利实体的 OpenAI 无论如何做不到的。这么多金融资本盯着,烧了这么多亿,如果不想办法把钱赚回来,很难交代。
所以 OpenAI 搞了 200 美刀的 o1 Pro 订阅,还号称要搞个 2000 刀的订阅。但现在,DeepSeek 完全不讲武德的免费开源,直接把天给捅破了。Sam Altman 这一周大概很难入睡了。
有趣的是,前晚美股大跌,不搞 AI 的苹果甚至涨了几个点。这个理由也很直接, 如果最顶级的 AI 已经平权使用,那么苹果之前 AI 进展的落后就可以抹平无视。
跌得最夸张的还是芯片行业,除了英伟达、AMD、TSMC 和生产芯片设备的阿斯麦,还有各种半导体指数。这个认知也很简单,既然 AI 不需要这么多算力,那这么多芯片就无人买单了。
如果大家还记得,英伟达在 AI 时代之前,也有过一次大起大落,当时因为区块链加密货币概念的火爆而大涨——因为挖矿需要英伟达的 GPU 卡,而区块链概念因为空气币暴雷而泡沫破灭后,英伟达的估值就一落千丈。但英伟达的命很好,因为紧接着就是 AI 时代的到来,AI 继续需要英伟达的 GPU,两者无缝连接。之后就有了所有人都知道的 AI 第一股 NVIDIA 英伟达。
拜登政府在下台前匆忙搞了个怼天怼地限制全世界算力,甚至连自己盟友都限制的三级算力限制法案,现在看起来有点像个笑话。美国人和资本不再担心算力的"国家安全",而是开始担心自己芯片卖不出去了。真是一个莫大的讽刺。
因此, DeepSeek 这两天已经被中文互联网冠以"国运级"事件,某种程度上也非常的恰当。恐怕过去中国为了对抗美国芯片封堵所做的所有努力,都没有 DeepSeek 这一次证明完全不需要那么多算力也能做出顶级 AI 大模型的影响来得深远。算力的需求直接降低了一个数量级之后,对中国和世界的芯片封锁恐怕就要打一个巨大的问号了。
而这一次对中国的正面影响是立显的:如果说之前,国内希望使用顶级 AI API 的企业只能绞尽脑汁用各种代理,冒着被国内监管和被美国公司封号的危险去用——这显然是无法成就长久事业的——那么现在, 所有国内希望用 AI 做事情的企业和个人,包括各种下游应用,各种具身智能,都开心地发现,我们现在可以光明正大的使用世界顶级的 AI API 了。这次 AI 的平权,首先直接受益的,是所有中国企业。
当然, 并不是 DeepSeek 拿出 R1,高端 AI 芯片就没有需求了。实际上无论是幻方还是其他中国公司,仍然需要大量算力。
但是,DeepSeek R1 是一个"种子",就像盗梦空间那个埋入人心的种子那样,这个种子成为了那些企图以芯片封锁中国科技进展的人脑海里一个挥之不去的梦魇——还要再封锁?是否继续适得其反?逼得中国人继续做出本来之前没必要去实现的重大创新。美国主流媒体的一些有识之士已经直接指出了这一点。
在上一篇文章里,有一位美国的老粉丝留言,指出城主文章的出发点还是打脸,而 DeepSeek 创始人成功是因为有着世界大同的高度, 然后做了个回复,两个留言都有很多的赞同:
其实城主想说的是, 打脸美国某些人,和祈望世界大同发展,人类共同进步完全不矛盾,命运共同体本来就是中国人民的发声。勤劳的中国人只希望有一个安居乐业的环境,无奈霸道至极的某国绞尽脑汁来打压而已。对这个情况, 有个网友的留言表达得很好:
一切才刚开始。 前晚 DeepSeek 继续发威,发布了基准评测超越 DALLE-3 和 Stable Diffusion 的原生多模态模型预览版,据说只用两百块卡训练了 2 周。DeepSeek 这是要把 AI 界的平权和创新之路走到底了。
这场轰轰烈烈的 AI 开源平权运动已经席卷了世界,妥妥的出圈让 DeepSeek 的 App 冲上美区榜首。但开源的意义是什么 ? 显然,并不是给 DeepSeek 和幻方带来直接收益。
但比钱更重要的是,打破对中国的技术封锁。这个封锁最直白的理解如前所说,国人可以自由使用最顶级的 AI 技术,再也不用偷偷摸摸翻墙去用 OpenAI 和 Claude 的 API,这个意义已然极大。
但更重要的封锁打破, 城主认为是反向的:让国产技术和世界重新融为一体。在美国宣传机器的污蔑和阻挠下,城主可以看到被洗脑的西方民众对来自中国的技术保持着某种"警惕性",但 DeepSeek 以绝对的性能和性价比摧枯拉朽地打破了这一切。所有美国顶级大学从 MIT 到斯坦福的学术研究机构都第一时间把自己用的 Llama 换成了 R1,估计目前没有人自讨无趣地提"使用来自中国的 AI 大模型是对美的安全威胁"了。
在绝对的实力面前,很多大佬也自觉不自觉地改变了观点。这几天传播最广的大佬言论莫过于马克 · 安德森发推盛赞 DeepSeek R1 是他多年来印象最深刻的突破,以及作为开源,是给这个世界的巨大馈赠礼物。这个推文在国内以及美国主流媒体都被广为报道。
但没有人提的是,马克 · 安德森对中国科技行业的过往评论很难说友好,只能说他对中国抱有一种全力提防的态度。如果了解他过往的公开访谈,我们可以知道,马克 · 安德森反对去投资中国科技行业,并以自己从不投资中国而自居,在意识形态里把中国当作一个最大的对手。
但就这么一位保守的科技大佬,面对着 DeepSeek R1 的开源,都不得不发出由衷的赞叹。更不用说各大科技博主在油管的自来水宣传,以及美国人民真金白银地用下载量把 DeepSeek App 推上苹果美榜第一宝座。
当美国人民享受着来自东方神秘力量的馈赠,收费 200 刀的昂贵 App 订阅变成了自由免费的产品,囊中羞涩的大学机构得以用极低的费用获得最顶级的 AI 的研究支持。我们可以想象,下一次还有人说要封堵中国科技要禁止中国发展要打断中美学术交流的时候,这些人会怎么想?
这种潜移默化的宣传效果,这种对中国封堵的反击,对人心隔阂的打破,才是真正的"王道"。而这才是城主所理解的,DeepSeek 创始人的"格局"——我们只需要把事情做到顶级,自然能打破一切桎梏。
前面说过,和开源还有一个相关论调," DeepSeek 把方法公开了,老美把技术复制了,继续封锁中国,还是中必输。"
本来这种没营养的言论不想再提,但考虑到这种言论还是有其欺骗性,可以简单讨论一下 :
DeepSeek 确实没法保证在开源的路上永远保持第一,但作为给世界带来火种的先行者,城主相信只要这个团队坚持当前成功的工作和研究文化,那么 DeepSeek 在 AI 开源社区的进步飞轮和影响力不会再落后于任何一家顶级组织。而在 DeepSeek 这一次无私的技术平权公开之后,AI 技术这个本来作为全世界共享的先进科学技术,不会再落入被私有大公司控制的局面。而且,更重要的,这个持续的 AI 开源进展将让中国重回世界科研的舞台中心, 任何说要拒绝来自中国的科学技术交流的言语,从昨天起都成为了一个笑话。
而对于国人, 还有个比打破西方人心隔阂更重要的意义,那就是 DeepSeek 的团队。到目前为止的所有公开信息, 都在说明这是一个纯血本土的团队,主要成员都是来自国内顶级高校的年轻人 (根据城主了解,幻方肯定还是有一些具有海外工作背景的同学,但这不矛盾)这个事实将极大地影响和树立国人对本土教育的自信。
此前很多前往美国的朋友,都是为了让孩子能够在美国接受最好的教育。城主也一直认为高等教育是美国的一面旗帜。而这两年众所周知国内能申请过去美国留学的同学被大幅减少了,做出这些政策的美国 zf,当然认为不让中国人接受自己的精英教育理所当然可以阻拦中国发展。
但 DeepSeek 团队的情况把这种比较流行的认知悄悄地撕开了一个口子。中国大学本科和研究生教育或许还有不尽人意的地方,但重要的是,依靠本土教育培养出的顶级年轻人才,纯血本土团队是可以做出超一流的成绩的。这个事实可以开始改变很多成见,包括一些琢磨着是否要送儿女到美国读书的父母的想法。
当然,走遍世界开拓视野是很有必要的,但是否意味着必须在某个美国高校学习才能有所成就呢?DeepSeek 团队给了我们一个很好的例子。
DeepSeek 引发的大地震还在持续,其影响之深远。在美国主流媒体都口中,都是以"近十年来"的口吻来评论的。DeepSeek 事件的出现有其戏剧性,也有必然性。无论在美国还是中国, DeepSeek 黑天鹅都在多个角度刷新人们的认知。除非 DeepSeek 直接躺平,否则这个团队及其 AI 成果的影响,还会以一种有趣的方式,持续下去。
上一篇:中国医药控股有限公司(CPHI.US)11月27日收盘报0.2美元/股,涨1.78%
下一篇:没有了