
定焦One(dingjiaoone)原創
一場關於「物理AI」的全球競賽,正在從PPT走向真實的戰場。
這幾天,聚光燈打在兩家企業身上。
一邊是小鵬汽車。11月5日,何小鵬公布小鵬汽車的目標是成為面向全球的具身智能公司,並發布了四個AI應用(小鵬第二代VLA大模型、小鵬Robotaxi、小鵬全新一代人形機器人IRON、匯天飛行汽車)。這意味著小鵬試圖告別「造車新勢力」的標籤,一腳踏入科技前沿的核心圈。

另一邊是特斯拉。11月6日的股東大會上,埃隆·馬斯克的萬億美元薪酬激勵計劃即將接受投票。這份方案的解鎖條件,與特斯拉在AI和機器人領域的戰略深度捆綁。
如果你覺得這兩件事只是巧合,那或許就低估了這股席捲全球的「物理AI」浪潮。英偉達CEO黃仁勛多次在公開場合斷言「物理AI」就是AI的未來。當這位手握全球AI算力命脈的「軍火商」都如此篤定時,一個問題隨之而來:
在「物理AI」的賽道上,中國科技公司將如何抓住機會、突破卡位,給出「中國解法」?
一部分目光聚焦在小鵬身上。樂觀派認為,小鵬正在以一種更系統的方式,複製甚至超越特斯拉的成功路徑,試圖在全球智能產業的牌桌上,為中國爭奪一個關鍵席位。
保守派則擔心,從「造車新勢力」到「全球具身智能公司」,跨度之大、挑戰之多,意味著小鵬的技術積累、資源投入與生態構建能力,都將面臨前所未有的考驗。
當「物理AI」成為科技圈新的集結號,小鵬的物理AI布局,是真正踩在了產業變革的鼓點上,找到了一個比特斯拉更落地的「中國答案」,還是一場雖然美好、卻落地艱難的資本遊戲?或許,在理解了小鵬構建的「物理AI」版圖後,答案就會變得清晰。
物理AI,為什麼是AI的終極戰場?
最近被科技圈捧上神壇的「物理AI」到底是什麼?它和我們熟悉的ChatGPT這類生成式AI,又有什麼根本的不同?
ChatGPT靠「吃」互聯網上的海量信息為生,能陪我們聊天,能寫詩、作畫。但它終究是一個關在瓶子里的「超級大腦」,無論多聰明,也不能幫你倒一杯水。
物理AI則不同,它有眼睛(攝像頭)、有耳朵(感測器)、有大腦(AI模型),更有能交互的手和腳(機械臂、車輪)。關鍵是,它能從「瓶子」里走出來,進入複雜的物理世界,像人一樣「思考」和「行動」。
我們以一個司機開車的場景為例,感受物理AI的完整閉環:
當你的眼睛「看見」前方的紅綠燈和行人,大腦會「看懂」它的含義——紅燈意味著停止,行人可能會過馬路。這就是感知與理解。
緊接著,你注意到一個皮球滾向馬路,瞬間預判到可能會有孩子追出來,於是,你決定提前減速。這就是預測與決策。
最後,你的腳踩下了剎車,車速平穩地降了下來。這就是行動與交互。
從「看見」到「看懂」,再到「預判」和「行動」,這套行雲流水的操作,正是物理AI追求的終極目標:讓機器能自主、安全地完成這個閉環。
下一個問題是,為什麼從黃仁勛、馬斯克到何小鵬,這些身處牌局中心的玩家,會不約而同地押注物理AI?
因為AI的價值,終究要落在改造物理世界上。無論是自動駕駛、工業製造還是家庭服務,最終都需要AI能指揮機器,在現實世界裡「幹活」。
AI一旦跨過這道坎,它就不再是飄在雲端的工具,而是會成為像水和電一樣的基礎設施,重塑整個實體經濟。對於中國而言,這更是我們從「製造大國」邁向「智能強國」,必須搶佔的戰略制高點。
看清了這一點,我們再去看特斯拉,就會發現它最厲害的,不是電池或電機,而是被馬斯克反覆提及的「世界模型」(World
Model)。這套模型就像一個通用的AI大腦,既能訓練自動駕駛汽車,也能調教Optimus人形機器人。
以自動駕駛為例,這個「世界模型」本質上是為AI司機創造了一個虛擬駕校。這個模擬世界可以生成任何可能的極端路況,讓AI司機「練車」。按照特斯拉的說法,AI在一天之內就能學習相當於人類幾百年駕駛時長的經驗。特斯拉的AI就是通過這種方式以指數級的速度迭代。
既然有玩家在先,我們還需要完全自研嗎?答案是肯定的,原因有二。
第一,是數據主權。智能汽車和機器人,本質上是移動的、全天候的「數據採集器」。它們所「看見」的道路環境、工廠布局,乃至家庭隱私,相當於數字時代的國土疆域。將這等規模的敏感數據交由他國公司處理,無異於將命脈交予他人之手。
第二,是產業主導權。物理AI,很可能就是下一代智能終端的「操作系統」。如果我們在別人的地基上蓋房,那就意味著,將利潤最豐厚、最具話語權的核心技術讓給他人,自己只能做應用層的組裝和集成。
更何況,特斯拉的「世界模型」源於其獲取的全球數據,而中國擁有全世界最複雜、最獨特的道路場景和用戶習慣,需要更好地理解並建模中國特有的物理環境。

可見,物理AI之爭,超越商業與技術本身,它是一場關於國家產業安全與未來發展戰略主動權的競爭。在這場戰爭中,中國必須擁有自己的核心技術和領軍企業。那麼,誰能扛起這面大旗?
小鵬的三張技術底牌
最近,市場的目光聚焦在小鵬汽車身上。在2025年小鵬科技日上,小鵬一口氣發布了四個AI應用:小鵬第二代VLA大模型、小鵬Robotaxi、小鵬全新一代人形機器人IRON、匯天飛行汽車。看似是跨行業,其實是為「物理AI」一個目標服務。
要讓AI進入複雜物理世界,首先要面對的問題就是AI如何思考、如何反應。小鵬給出的解決方案是第二代VLA大模型,它最核心的特點,是讓AI擁有「直覺」。
還是以前文提到的司機開車的場景為例,一個經驗豐富的司機看到路邊滾出的皮球,會下意識地踩下剎車,這個過程幾乎沒有複雜的邏輯推理。但傳統的自動駕駛AI卻做不到。它需要先「看」到皮球(視覺感知),然後把視覺信息「翻譯」成機器可以理解的語言或指令(語言模型),再讓系統「理解」這個指令的含義(規劃決策),最後才「執行」剎車動作。中間的「翻譯」環節,無疑拖慢了反應速度。
小鵬的第二代VLA,就是要拿掉「翻譯」環節,採用「視覺—隱式Token—動作」的架構。這裡的「隱式Token」可以理解為一種AI內部的、非語言的「心領神會」,讓AI從「看到」直接跳到「行動」。這就像是給AI訓練出了「肌肉記憶」或「直覺」。它不再需要「思考」皮球的危險性,而是能憑藉從海量數據學習到的物理規律,本能地做出反應。
在實際駕駛中,這種「AI直覺」會給用戶帶來什麼改變?總結來說就是,反應更快,駕駛更擬人,不依賴地圖時,也能更穩定、自主地駕駛。
例如,在沒有高精地圖覆蓋的次級道路上,小鵬數據顯示,其「小路NGP」(在非主幹道上的智能駕駛)功能的平均接管里程優化了13倍。同時,小鵬發布的「無導航超級漫遊」(Super-LCC)功能,也讓車輛在無預設導航路徑時,憑藉對環境的實時理解進行駕駛輔助。
本質上,小鵬選擇的技術路徑是,教會AI「憑本能反應」。這是智能體進入物理世界的第一步,也是最關鍵的一步。
有了能快速反應的「大腦」,物理AI最終要落在能執行動作的「身體」上。小鵬沒有為每個硬體都開發一個專門的AI,而是把「大腦」用在三種不同的「身體」上:汽車、人形機器人和飛行汽車。這並非簡單的「一芯多用」,而是在培養全能型的「通才」。

我們可以這樣理解:AI在駕駛汽車時學到的經驗,比如如何識別紅綠燈、如何預判行人意圖,可以被無縫遷移到人形機器人身上,幫助它在複雜的商場里規劃路徑、避開行人。
在這個「跨域同源」的設計下,知識可以共享,經驗可以復用,學習效率遠高於訓練三個獨立的「專才」。關鍵是,這套「一腦多用」的架構,更能解決物理AI落地的關鍵難題:如何讓AI的能力突破單一場景,在複雜的現實世界中靈活應變、舉一反三。
接下來的問題是,「大腦」和多功能的「身體」如何高效協同工作?這就觸及了最底層的體系,就像我們身體的「神經系統」。小鵬選擇全棧自研,通俗地理解,就是打造一套穩定、自主可控的「神經系統」。
我們可以用蘋果的例子來理解「全棧自研」的分量。蘋果之所以能構建起強大的生態壁壘,核心就在於它自己設計晶元(A系列/M系列),自己開發操作系統(iOS/macOS),自己設計硬體(iPhone/Mac)。這種模式確保了指令從大腦到身體的傳遞過程中,損耗最小,響應最快。它以此實現了深度的優化與整合。
小鵬的路徑頗為相似:從最底層的「圖靈AI晶元」,到中間的「操作系統」層「VLA/VLM/VLT大模型體系」,再到上層的汽車、機器人、飛行汽車等硬體,所有核心環節都掌握在自己手中。這確保了其物理AI架構形成一個獨立性、完整且不受制於人的閉環。
至此,小鵬的技術版圖已經清晰:「直覺式」AI模型+「跨域同源」的多種硬體+「全棧自研」的技術架構。
更落地的「中國方案」
看清了小鵬的技術底牌,一個更現實的問題隨之而來:這套架構在行業中究竟屬於什麼位置?小鵬又打算如何將其推向市場?
答案其實就藏在它的定位上。小鵬強調,它是「中國唯一實現物理AI全棧自研」的企業。
要理解這一點,最好的對標對象是華為。華為的盤古大模型體系中包含了世界模型技術,但其商業模式是向行業提供智能駕駛解決方案與算力服務,本質是向外輸出通用能力,目前並不親自下場製造硬體載體。它的角色,更像是物理AI時代的「英特爾」或「高通」。
而小鵬確實是目前唯一一個展示「多類具身智能載體+統一AI大腦+關鍵硬體自研」布局的公司。這樣做最大的好處就是,能實現深度的「軟硬一體」,帶來的直接結果是,用戶體驗更流暢,技術迭代也更迅速。
這條路無疑耗資巨大、難度極高,但一旦走通,所構建的軟硬一體生態,也將是別人最難複製和超越的壁壘。

那麼,小鵬這套「全家桶」要怎麼「賣」出去?
回顧科技史,任何一個新平台的崛起,都伴隨著路線之爭。在移動互聯網時代,這表現為谷歌和蘋果兩種模式:谷歌通過開源的安卓系統,聯合各大硬體廠商,構建了一個龐大「聯邦」;蘋果憑藉自研的iOS系統與AppStore,打造了一個利潤豐厚的「封閉帝國」。
在智能駕駛領域,特斯拉是典型的「帝國」模式,通過「硬體(汽車)+軟體(FSD)+數據(全球車隊)+能源網路」的垂直整合,構建了封閉生態。在這個生態里,它享受品牌溢價和利潤。
小鵬顯然不是正面硬剛特斯拉,它更像在構建一個「聯盟」。從其最新的兩個動作能看出這一意圖:
第一招是輸出核心技術。大眾汽車已確認成為第二代VLA,及小鵬自研圖靈AI晶元的首發戰略合作夥伴。這步棋很高明:與其讓大家重複造輪子,不如讓有影響力的玩家先用上自己的「輪子」。這不僅能驗證了技術的通用性,更能「借船出海」,在全球範圍內快速推廣自己的技術標準。
第二招是開源核心工具包。小鵬宣布Robotaxi將開放SDK(Robotaxi業務的核心軟體開發工具包),與全球夥伴共建Robotaxi生態,高德地圖已加入。
小鵬的商業模式逐漸清晰:對內,通過「全棧自研」保證技術的領先與協同;對外,通過開放技術標準來吸引參與者、壯大生態。它顯然不再滿足做一家汽車製造商,而是希望成為物理AI時代的「平台服務商」甚至是「規則制定者」。
結語
資本市場,本質上是為「未來」定價的地方。一家公司的價值,不僅取決於當期的財報,更在於未來的想像力。過去,資本市場常將小鵬與其他造車新勢力一併看待,如今,隨著「物理AI」戰略的發布,小鵬的估值邏輯有望從「智能汽車公司」拉升到「全球具身智能平台」。
支撐這個新邏輯的,有三個可見的轉變:
一是從「賣車」轉向「技術變現」。與大眾的合作是一個關鍵節點,它表明小鵬的AI技術可以作為獨立產品產生價值,打開了技術授權這條更高利潤的收入來源。
二是從硬體銷售到生態服務。通過開源Robotaxi平台,小鵬正在構建一個可持續的服務模式,未來從自動駕駛服務中持續抽成。
三是從「造車」到「造智能體」。其業務範疇已從汽車,擴展至能上天(飛行汽車)、能入地(機器人)的各類智能實體。
當然,這條路走起來並不輕鬆。小鵬在未來幾年需要處理好幾個現實問題:
第一是錢和人的分配。自研技術、同時做車、機器人和飛行汽車,每一樣都很燒錢,也很依賴頂尖人才。怎麼把錢花在刀刃上,確保幾個業務都能穩步推進,是首要的課題。
值得關注的是,從小鵬2025Q2財報來看,公司基本面持續向好:毛利率已經連續多個季度正增長,在手現金儲備增加到了476億元。這些數字說明,小鵬在為物理AI大舉投入的同時,當下的主業也在加速自己「造血」。更有說服力的是,公司管理層依然維持了第四季度實現盈虧平衡的預期。

第二是用商業成果說話。再好的技術構想,最終都需要接受市場的檢驗。小鵬需要持續拿出實際進展,一步一步驗證技術藍圖。
從長遠來看,科技公司的價值往往建立在兩個基礎上:一是提前看到方向,二是能堅持走下去。小鵬選的這條路,踩在了AI與實體產業結合的趨勢上。接下來就看它能否持續將技術轉化為可用的產品,再將產品轉化為可持續的商業模式了。