首页 能100%提现的赚钱游戏支付宝介绍 产品展示 新闻动态
吓崩英伟达,戳破AI泡沫,华尔街怎么看DeepSeek?
发布日期:2025-02-02 20:21    点击次数:159

DeepSeek 一夜爆火,不仅刷屏全球互联网,还被多次"挤"到宕机,甚至暴击华尔街,分析师惊呼 AI 企业迎来"斯普特尼克时刻"。

周一美股盘前,美股期货大跌,纳斯达克 100 指数期货跌 5%,标普 500 指数期货跌近 3%,道指期货跌超 1%。

半导体股盘前跌幅扩大,英伟达跌逾 13%,博通跌超 11%,阿斯麦跌近 11%,超微电脑跌超 10%,台积电跌近 10%。整个欧美科技股市值或蒸发 1.2 万亿美元。

美股这一崩溃正是 DeepSeek 引发,就在刚刚过去的周末,DeepSeek 反超 ChatGPT,在能力、成本、开放性等多项数学和推理基准测试中超越业界领先模型,一举登顶美区苹果应用商店免费 App 排行第一。

DeepSeek 引发了全网激烈讨论,而真正引人注目的是其打破传统 AI 资本支出规模。

开发该模型仅用 2 个月,花费不到 600 万美元,相比之下,Meta 团队仅薪酬就超过 DeepSeek 全部培训预算,Open AI 每年支出超过 50 亿美元,"星际之门"计划正生成投资 5000 亿美元 ......

华尔街怎么看 DeepSeek?DeepSeek 对整个 AI 行业意味着什么?

华尔街:AI 企业盈利面临走低风险、美股迎来 AI 泡沫破灭的时刻

杰富瑞分析师 Graham Hunt 团队指出,科技巨头们面临资本支出合理性的质疑,或导致数据中心收入和利润增长轨迹走低:

由于 DeepSeek 仅以一小部分计算能力就能提供与 GPT-4o 相当的性能,这对建设者来说可能会产生负面影响,因为人工智能参与者面临着证明不断增加的资本支出计划合理性的压力,最终可能导致数据中心收入和利润增长轨迹走低。

我们看到至少两种潜在的行业战略,中国出现了更高效的训练模型,这些模型被推动进行创新,进一步加剧中国在人工智能领域的主导地位竞争。对于数据中心建设者来说,关键问题是,他们是否继续采取"不惜一切代价建设"的战略,加速模型改进,或者现在是否将重点转向更高的资本效率,给主要人工智能参与者的电力需求和资本支出预算带来压力。短期内市场将采取后者。

短期内降级风险,收益受影响较小。尽管数据中心相关公司容易受到情绪降级的影响,但其收益不会立即受到影响。资本支出计划的任何变化都具有滞后效应,具体取决于持续时间(>12 个月)和订单簿中的风险敞口。我们认为现有订单变更或取消的风险有限,并预计现阶段人们的预期将转向由更高效的模型推动现有投资更高的投资回报率。总体而言,我们仍然看好该行业,规模领导者受益于不断扩大的护城河和更高的定价能力。

瑞穗则提到,这发生在一个"痛苦的时刻":

我们刚刚看到星际之门公告(到 2028 年预计约为 5000 亿美元)和 Meta 将资本支出正式提高到 600-650 亿美元以扩大 Llama 规模,当然还有微软 800 亿美元的公告……市场现在想知道这是否是市场人工智能泡沫破灭的时刻(例如思科的互联网泡沫),英伟达是标普 500 指数中权重最大的单一公司,占 7%。

花旗分析师 Atif Malik 认为, AI 公司不会放弃更先进的 GPU:

虽然 DeepSeek 的成就可能具有开创性,但我们质疑其成就是否是在没有使用先进的 GPU 对其进行微调和 / 或通过蒸馏技术构建最终模型所基于的底层 LLM 的情况下实现的。尽管美国公司在最先进 AI 模型上的主导地位可能会受到挑战,但我们估计在不可避免的更严格的环境中,美国公司仍然占据优势。因此,我们预计领先的 AI 公司不会放弃更先进的 GPU,最近 AI 资本支出公告表明了对先进芯片的需求。

伯恩斯坦报告认为, DeepSeek 实际上讨论的是两个模型系列,但价格战的言论足以让 Mag7 本已不明朗的投资回报率雪上加霜:

第一个系列是 DeepSeek-V3,这是一个混合专家 ( MoE ) 大模型,通过一系列优化和巧妙的技术,它可以提供与其他大型基础模型相似或更好的性能,但训练所需的计算资源却很少。DeepSeek 实际上使用了 2048 个 NVIDIA H800 GPU 集群进行训练约 2 个月。经常引用的" 500 万美元"这个数字是通过假设该基础设施的租赁价格为 2 美元 /GPU 小时来计算的,但不包括与架构、算法或数据的先前研究和实验相关的所有其他成本。

第二个模型家族是 DeepSeek R1,它使用强化学习 ( RL ) 和其他创新技术应用于 V3 基础模型,大大提高了推理性能,与 OpenAI 的 o1 推理模型和其他模型竞争激烈,这个模型似乎引起了大部分的焦虑)。DeepSeek 的 R1 论文没有量化开发 R1 模型所需的额外资源。

V3 的相对效率应该令人惊讶吗?作为 MoE 模型,我们并不这么认为……混合专家 ( MoE ) 架构的意义在于显著降低训练和运行成本。对其他 MoE 比较的调查表明,与性能相似的类似大小的密集模型相比,V3 的典型效率约为 3-7 倍;V3 看起来甚至比这更好(>10 倍),可能是因为该公司在模型中引入了一些其他创新,但认为这是一种完全革命性的东西似乎有点夸大其词,并不值得过去几天在 Twitterverse 上引起轩然大波。

但价格战的言论足以让 Mag7 本已不明朗的投资回报率雪上加霜。DeepSeek 的定价确实远远超过了竞争对手,该公司的模型定价比 OpenAI 的同类模型便宜 20 到 40 倍, 当然,我们不知道 DeepSeek 在这方面的经济效益(而且这些模型本身是开放的,任何想要使用它们的人都可以免费使用),但整个事情提出了一些非常有趣的问题,关于专有与开源努力的作用和可行性,可能值得做更多的研究……

对 AI 行业意义:竞争急剧加剧、科技巨头"护城河"变"小水坑"、颠覆速度加快

对 AI 行业意义方面,dropbox AI 副总裁 Morgan Brown 做了一系列的总结:

1、首先,介绍一些背景:目前训练顶级 AI 模型的成本极其高昂。OpenAI、Anthropic 等仅在计算上就花费了 1 亿美元以上。他们需要拥有数千个 4 万美元 GPU 的大型数据中心,这就像需要一整座发电厂来运行一家工厂一样。

2、DeepSeek 突然出现并说,如果我们花 500 万美元做这件事会怎么样?"他们不只是说说而已——他们真的做到了。他们的模型在许多任务上匹敌甚至击败了 GPT-4 和 Claude。人工智能世界震动了。

3、怎么做到的?他们从头开始重新思考一切。传统 AI 就像是把每个数字都写成 32 位小数,DeepSeek 是如果我们只使用 8 位小数呢?它仍然足够准确!砰——所需内存减少了 75%。

4、然后是他们的多标记预测,普通人工智能的阅读方式就像一年级学生一样:"这 ...... 猫 ...... 坐 ...... " DeepSeek 一次读完整个短语,速度快 2 倍,准确率高 90%。当你处理数十亿个单词时,这一点很重要。

5、但真正聪明的是:他们建立了一个"专家系统"。他们没有使用一个试图了解一切的大型人工智能(比如让一个人同时成为医生、律师和工程师),而是拥有只在需要时才醒来的专门专家。

6、传统模型:所有 1.8 万亿参数始终处于活动状态,DeepSeek 总共 671B,但一次只能激活 37B。这就像拥有一支庞大的团队,但只召集每个任务真正需要的专家。

7、结果令人震惊:培训成本:1 亿美元 → 500 万美元;所需 GPU:100000 → 2000;API 成本:便宜 95%;可以在游戏 GPU 而不是数据中心硬件上运行。

8、最疯狂的部分都是开源的,任何人都可以检查他们的工作,代码是公开的,技术论文解释了一切。

9、重要的是,它打破了"只有大型科技公司才能涉足人工智能"的模式,你不再需要价值数十亿美元的数据中心,几个好的 GPU 就可以做到这一点。

10、对于英伟达来说,这很可怕。他们的整个商业模式都建立在销售利润率高达 90% 的超级昂贵 GPU 的基础上,如果每个人都能突然用普通的游戏 GPU 做 AI ……那么,你就知道问题所在了。

11、关键在于:DeepSeek 的团队不到 200 人,但 Meta 的团队仅薪酬就超过了 DeepSeek 的整个培训预算……而且他们的模型并不那么好。

12、这是一个经典的颠覆故事:既有者优化现有流程,而颠覆者重新思考根本方法。

13、影响巨大:人工智能开发变得更加容易;竞争急剧加剧;大型科技公司的"护城河"看起来更像水坑;硬件要求(和成本)大幅下降。

14、OpenAI 和 Anthropic 等巨头不会止步不前。他们可能已经在实施这些创新,但效率精灵已经从瓶子里出来了——不可能再回到"只是投入更多 GPU "的方法了。

15、最后的想法:这感觉就像是我们回顾时会认为的一个转折点,就像个人电脑让大型机变得不那么重要,或者云计算改变了一切。人工智能即将变得更加普及,成本也更低。问题不在于它是否会颠覆当前的参与者,而是颠覆的速度有多快。

英伟达正面临前所未有的威胁

此外,还有分析表示,英伟达实际上很难达到市场的高期望。分析表示,英伟达面临着前所未有的竞争威胁,20 倍预期销售额和 75% 毛利率的溢价估值越来越难以证明其合理性。该公司在硬件、软件和效率方面的所谓"护城河"都出现了令人担忧的裂痕,地球上数以千计最聪明的人,在数十亿美元的资本资源的支持下,正试图从各个角度攻击他们。

在硬件方面,Cerebras 和 Groq 的创新架构表明,英伟达的互连优势(其数据中心主导地位的基石)可以通过彻底的重新设计来规避。更传统的是,每个主要的英伟达客户(谷歌、亚马逊、微软、Meta、苹果)都在开发定制芯片,这可能会蚕食高利润数据中心的收入。

软件护城河似乎同样脆弱,MLX、Triton 和 JAX 等新的高级框架正在抽象化 CUDA 的重要性,而改进 AMD 驱动程序的努力可能会解锁更便宜的硬件替代品。最重要的是,我们看到了 LLM 驱动的代码转换的出现,它可以自动将 CUDA 代码移植到任何硬件目标上运行,从而有可能消除英伟达最强大的锁定效应之一。

最令人震惊的是 DeepSeek 最近的效率突破,以大约 1/45 的计算成本实现了可比的模型性能。这表明整个行业一直在大量过度配置计算资源。再加上通过思维链模型出现的更高效的推理架构,对计算的总体需求可能比目前的预测要低得多。这里的经济效益是令人信服的:当 DeepSeek 能够达到 GPT-4 级别的性能,同时 API 调用费用降低 95% 时,这表明要么的客户在浪费资金,要么利润率必须大幅下降。

台积电将为任何资金充足的客户生产具有竞争力的芯片,这一事实自然限制了英伟达的架构优势。但从根本上讲,历史表明,市场最终会找到绕过人为瓶颈的方法,从而产生超额利润。

这些威胁加在一起表明,英伟达在维持其当前增长轨迹和利润率方面面临的困难要比其估值所暗示的要大得多。有五个不同的攻击方向——架构创新、客户垂直整合、软件抽象、效率突破和制造民主化——至少有一个成功对英伟达的利润率或增长率产生重大影响的可能性似乎很高。按目前的估值,市场还没有将这些风险中的任何一个计入价格。



Powered by 能100%提现的赚钱游戏支付宝 @2013-2022 RSS地图 HTML地图