北歐神話中的屠龍少年西古爾德,殺死巨龍法夫納后用龍血沐浴,從而全身長滿鱗片變得刀槍不入,但他洗澡時一片葉子落到了肩膀上,這里成為他唯一的弱點,而且是致命的,最后他也因此而被結拜兄弟殺死。
人可以有弱點,但這個弱點不能致命。
我去全球第二大的軍火供應商雷神集團面試,英語面試時說得磕磕巴巴,公司說:“說你不能交流呢,你還是能說一些,但說你能交流呢……算了,進來有語言環境后練習幾個月就好了。”于是我就進去了,英文口語只能算我的弱點,不能算命門。
![]()
華為、中興、聯想在芯片上都是弱項,但對中興、聯想而言這是致命的弱點,所以2018年中興事件發生后中興立刻跪了,無條件接受美國方面的規定和處罰,所有部門無條件且“脫得精光”地接受美國監管,沒有任何機密可言,用“屈辱”二字形容不為過。
聯想是比較“聰明”的,玩的是皇帝的新衣,不用你說,自己先脫光,還裝模作樣一副我弱我有理,惹毛了就高喊兩句“科技無國界”,所以現在聯想暢通無阻地玩轉全球,因為它真得很弱,對美國而言沒有任何威脅。
這就像當年拉涅利在切爾西的待遇一樣,溫格和弗格森都稱贊他是好人,但等切爾西的主教練換成穆里尼奧后,溫格和弗格森就開始破口大罵了,再無紳士風度。因為拉涅利率領的切爾西就是弱雞,對兩人的球隊構不成任何威脅,換作穆里尼奧后一上來就把他們拉下冠軍寶座。
芯片對華為而言雖然也是弱項,但華為已經解決了有無的問題,它對華為而言不致命,但對美國來說就是致命的威脅,所以美國對華為是嚴防死守,從設計到制造、檢測……全方位圍堵。
這種情況下華為是不能倒,更不能輸的,因為華為太強了,太能打了,以一當十,讓美國寢食難安。華為芯片和手機業務力抗高通和蘋果,操作系統以一敵二挑戰谷歌和微軟,AI芯片亮劍英偉達,數據庫硬剛甲骨文Oracle,盤古大模型對決OpenAl……
這就像當年蒙古攻打西夏一樣,因為對手太強了,征服西夏后讓成吉思汗心驚不已,下令黨項之間不得通婚,目的是避免養虎為患,必須斬草除根。
西夏敗了,黨項人消失在歷史長河之中,華為如果敗了,同樣沒有投降和茍延殘喘一說,這樣的對手活著就是罪過和威脅。
所以華為必須贏,因為祖國必須“升”。華為代表的已經不只是中國科技力量的崛起,而是一種不屈的精神,民族復興和中國崛起的圖騰,大匠功成時的赤霞滿天。
利物浦名帥比爾·香克利說過:“足球無關乎生死,卻高于生死。”同理,華為無關乎戰爭,但兇險程度遠高于戰爭。
2024年,美國打壓六年后發現華為的科技韌性十足,越壓越強,已經無法全面壓制華為。于是美國調整策略,集中力量于一點欲打掉中國的AI產業,也是全球未來二十年的經濟和國運增長點。
![]()
實際上,這場科技戰爭中美國并不擔心DeepSeek,也不擔心通義千問、豆包、夸克這些公司和模型。因為這些公司無論內功練得再好,外家功夫完全是不設防的,不堪一擊。
美國掌握著它們的命門——AI芯片,猶如天山童姥握著三十六島七十二洞高手的“生死符”,做到了閻王要你三更死,不會留你到五更的底氣。
但華為昇騰芯片問世后,尤其是最新一代的“昇騰384超節點”技術讓美國人真急了。因為“昇騰384超節點”的性能對標英偉達NVL72,通信帶寬提升15倍,已經到了能和美國扳手腕的地步。
更讓美國害怕的是華為找到了在AI芯片上不對稱作戰的密匙——光子通訊技術,即在超節點范圍內用高速總線互聯替代傳統以太,通信帶寬提升了15倍,通信時延從2微秒做到200納秒,降低了10倍。
這幾乎實現了AI算力芯片之間近乎無縫的連接。
AI模型算力為王,其理論原理如同航天火箭的運載能力,要想推力大就盡可能并聯越多的發動機。對火箭而言,發動機并聯后的最大難題是發動機工作時彼此之間的干擾、湍流和共振。
AI芯片想提升算力同樣需要并行處理,將上萬顆處理器并接在一起進行擴展。這時的關鍵是運算的協同和數據的交換,負責擴展而連接芯片之間的跨機帶寬成為最為關鍵的瓶頸和技術。
跨機寬帶好比第一次漢城戰役中的漢江大橋,當時南韓軍隊大敗,潰兵和老百姓全部擠到漢江大橋上往對岸逃命,人多橋窄很快形成擁堵,根本無法做到有序和及時撤離。
最后李承晚不得不壯士斷腕,在橋上依舊還有大批韓國軍民、車輛和坦克的情況下下令炸橋。兵馬再多,無法撤退到對岸都是白搭。
英偉達的優勢是芯片算力,華為的優勢是通訊技術,當AI集群技術到來的時候,英偉達和華為的優勢是各有千秋了。
英偉達的AI芯片相當于是時速400公里的法拉利跑高速,華為的CloudMatrix 384昇騰芯片相當于是巡航速度150公里的彩虹-10傾轉旋翼機天高任鳥飛。
AI密集型模型是既要算力,也要高速通訊通道,二者缺一不可。
在華為創新的架構和光子通訊加持下,華為用12個計算柜和4個總線柜把384顆昇騰AI處理器集合在一起,實現300 PFLOPS的最大算力和48TB的高速內存(注:1 petaflop=每秒1千萬億次運算)。
而且多個這樣的昇騰384芯片還可以再相互組合,通過華為超節點技術這種組成方式,目前最大的集群是華為十萬卡級的Atlas 900 SuperCluster超節點集群。
測試結果顯示,昇騰超節點384在處理Meta的LLama 3等密集型AI模型時,單卡性能達到132 tokens/秒(TPS),是傳統集群的2.5倍。對于Qwen以及DeepSeek等通信密集型多模態及MoE模型,華為架構的單卡性能達到600至750 TPS,也實現了3倍以上性能的提升。
![]()
當前華為CloudMatrix 384使用的是昇騰910C處理器,910C性能是英偉達H100的60%。華為現在的解決方案是依靠規模優勢和領先的通訊技術抵消自身單個芯片性能較弱的不足。
總結,目前的現狀是華為在芯片技術上落后美國一代,但其擴展解決方案比英偉達和超微半導體(AMD)當前的市場產品領先一代。
而且華為AI算力芯片的更新速度更快,媲美H100的910D已經試產,將在月底公測,第三季度對外供應。
目前唯一制約中國芯片發展的是光刻機,如同當年我國的戰斗機發動機一樣,在持續不斷地投入之下,突破是遲早的事。一旦突破,華為的芯片制造技術迎頭趕上,而擴展方案又一馬當先,那時就是中國重塑下一代AI模型訓練的整個底層邏輯了。
留給美國的時間不多了。這就像當年毛主席說的一樣:“封鎖吧,封鎖個十年八年的,我們就全部都有了。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.