老伙计们,我是马国华。
今天聊个有意思的事。上周富国银行出了一份报告,说亚马逊AWS可能会采购高通的AI200芯片,目的是降低AI推理成本。这消息一出,高通股价应声涨了,亚马逊那边呢?沉默,但内部据说吵翻了天。很多人说:“好事啊,多一个供应商,AWS终于能跟英伟达讨价还价了。”
但我告诉你,这份报告里藏着一把软刀子,是冲着AWS的决策层去的——它不是好消息,而是一个精心设计的“沉没成本陷阱”。
先看事实。富国银行的报告逻辑很简单:AWS目前在推理成本上压力很大,英伟达的H100虽然强,但贵。高通AI200单颗芯片支持768GB内存,2026年部署,而且AWS已经用过AI100 Ultra,觉得性价比不错。所以富国银行预测,AWS会“深化与高通的合作”。
听着没毛病对吧?但反常的是,富国银行作为投行,它为什么要替高通吆喝?它又不是高通的白衣骑士。更诡异的是,报告里专门提了一句:“AWS目前在英伟达CUDA生态上有大量投入和优化经验,但这些经验难以快速迁移到高通平台。”——这句才是关键。
我在供应链做了三十年,太清楚这句话的分量了。它表面上是在提醒风险,实际上是给AWS的决策者心里放了一根刺:“你已经在英伟达身上花了2000亿美元的AI资本支出,如果现在转头去试高通,那之前投的钱不就打水漂了吗?”
这就是富国银行最要命的杀招——它不是在预测未来,而是在强化AWS的旧投资包袱。你想啊,AWS的CTO如果看到报告,第一反应是什么?他不可能拍桌子说“立刻下单高通”。他脑子里会飞速盘算:我们现在有3万人的AI团队,80%的训练和推理都在英伟达生态上跑,从CUDA改到高通的SDK,至少需要一年半,期间业务停摆风险谁来担?那2000亿美元的数据中心建设,机柜、散热、网络全是按英伟达的参考架构设计的,换芯片等于换整个底层。这可不是买台新服务器那么简单。
所以富国银行的报告,表面上是给高通带货,实际上是让AWS自己跟自己打架:你越想省钱,就越不敢动;你越不敢动,就越要追加英伟达的订单来维持稳定。结果是什么?AWS可能会加购更多H100,而不是测试AI200。而富国银行作为英伟达的大投行伙伴(它也是英伟达的做市商之一),这波操作既让市场觉得英伟达地位稳固,又让AWS继续买单。
那AWS该怎么破这个局?按照我的习惯,不讲虚的,直接给出实操路径。
第一步,别跟报告走,跟数据走。AWS应该立刻成立一个“芯片经济学”内部小组,独立于现有采购团队,用真实的工作负载(比如Llama 3 405B推理)去跑高通AI200的测试机,而不是看富国银行的实验室数据。并且,要把测试结果直接向CFO汇报,不经过CTO——因为CTO天然偏向已有生态,他怕打脸。测试周期不能超过两个月,要的就是最干的数据:每美元能推理多少个token,延迟多少,功耗多少。
第二步,用这份报告当砍价刀。AWS的采购老大可以拿着富国银行的报告直接拍在英伟达的谈判桌上:“你们再不降价,市场上已经有替代方案了。”哪怕最后根本没买高通,这个动作也能逼英伟达在下一轮采购合同里给折扣。这招我在以前的供应链里用过:供应商最怕的不是你真的换,而是你手里有能换的牌。
第三步,做最坏的准备,但分步走。AWS不需要全面转向高通,而是在一个冷门区域(比如美西的冗余数据中心)先部署2000块AI200,只跑非核心推理负载(比如OCR、图片分类),积累一年的运维数据。这样既不伤筋动骨,又真真实实知道高通的底牌。等数据出来再说下一步。
你看,这三个动作没有一个是在“赌高通”,都是围绕着一个核心:把主动权收回到自己手里,而不是被投行报告牵着鼻子走。这才是大厂在面对外部诱导时该有的反击。
好了,案例讲完,说一句扎心的本质:
标准重写型压制。
什么是标准重写?就是强势方(投行)通过定义“新旧技术迁移成本”,让你自己放弃破局选项,从而继续在旧轨道上行驶。你以为是格局之争,其实是别人用你的历史投资在卡你的脖子。
所以,如果你的公司也在面对类似的“第三方报告诱惑”——比如咨询公司说你要上云,或者审计师说你要换ERP——先问自己一个问题:这份报告的最终受益方是谁?如果受益方是现有供应商,那它说的每一分“风险”,都可能是你的“沉没成本税”。
别急着为了证明“过去没选错”,而把未来的出路焊死。这才是今天最想跟你说的。
