今年六月,奧特曼在與其弟弟Jack Altman(Lattice創始人)的訪談中提到了OpenAI的未來發展方向。
他描繪了一個宏大的願景:構建一個無處不在的「AI伴侶」生態系統。他說,「消費者最終想從我們這裡得到的是一個AI伴侶。它了解你和你的目標以及你想要完成的事情和你的信息。」
這一願景也正在全球科技巨頭間形成共識。但目前來看,谷歌跑得更快一點:2025年I/O大會上展示的Project
Astra,正是一個能夠與現實世界多模態交互、理解複雜上下文的通用AI助手的雛形。
然而,不夠成熟的模型技術、智能設備在形態和續航上的固有瓶頸,都讓它的發展止步不前,但勇於探索的創業者們已經開始另闢蹊徑,邁出了第一步。
有趣的是,在2024年末和2025年初這個時間點下,有此野心的創業者中有很多都不約而同地選擇了用」吊墜「這個硬體形式,試圖搶先登陸個人AI的灘頭。
圖:吊墜形態的AI硬體產品
除去Limitless Pendant的野心稍窄之外,Friend
AI、Sein以及剛剛在北美髮布的Looki,都把他們的產品底層邏輯,定位到了「帶有記憶能力的個人AI」上。
Looki CEO孫洋是前美團智能硬體負責人、Momenta高級研發總監、Google Assistant創始成員。
孫洋離開谷歌,把在谷歌未完成的心愿放到了自己的創業項目:「我們的願景其實和Google的很像——我們想做human-centered
AI,把AI真正帶到生活中來,而不僅僅是工作場景。\”
那為什麼會弔墜這個硬體形態?想要實現個人的AI伴侶,所需的必要條件是什麼?創業公司在巨頭爪牙下,還有什麼突圍機會?騰訊科技近期與孫洋針對新產品進行了交流,試圖釐清這股AI硬體小熱潮的底層邏輯。
01 Looki:一個全天候的生活記錄員
從外觀上看,Looki很容易讓人聯想到Humane AI
Pin。它同樣採用磁吸式設計,可以方便地佩戴在衣物上。但兩者的產品哲學卻截然不同。
孫洋離開谷歌,把在谷歌未完成的心愿放到了自己的創業項目:「我們的願景其實和Google的很像——我們想做human-centered
AI,把AI真正帶到生活中來,而不僅僅是工作場景。\”
Humane AI Pin還是在Chatbot應用的路徑上,而Looki則就是一個多模態信息採集器。
Looki的核心功能是「間隔拍攝」的「故事模式」。用戶通過長按設備上的按鍵啟動後,這個小掛件便進入了真正的「全天候記錄」狀態,以預設的間隔(如每分鐘拍7秒,或每10分鐘拍30秒)自動捕捉第一視角的短視頻。
「一旦啟動故事模式,用戶就可以佩戴在身上,完全無感地生活。」孫洋表示。無論是帶孩子去遊樂場,還是進行戶外運動,設備都會默默記錄下這些珍貴的瞬間。
為了支撐這種不間斷的記錄,Looki採用了經過優化的成熟硬體方案:搭載索尼IMX681攝像頭,支持1080P
30幀錄製,內置32GB存儲空間,配備的電池在間隔拍攝模式下續航可達12小時。
這些參數表明,Looki並未追求極致的影像畫質,其硬體甚至可以在深圳的電子市場快速配齊。
那為什麼要做成掛件的樣式?
孫洋的回答非常直接,也很真實:「我們並不特別在意硬體的具體形態(Form
Factor)。今天的掛件,未來可能是成熟的智能眼鏡或耳機。」
而當前的設計,是在現有技術約束下,滿足「全天候可佩戴記錄裝置」這一核心需求的最佳妥協方案。
這個看似簡單的裝置,解決了通往個人AI道路上一個最根本的問題:為AI提供持續、靜默、且富含上下文的多模態信息。
02 硬體不過是醋,個人AI才是餃子
一個真正的AI助手,最重要的能力之一就是「靜默」。它不應該在每一次需要幫助時都由用戶主動喚醒,而應能基於對用戶狀態和環境的理解,主動提供服務。而這一切的前提,就是擁有完整的上下文。
過去的AI系統,獲取個人上下文的途徑極其有限。它們能接觸到的,大多是與個人生活細節無關的文字信息,如圖書、網頁等。這些信息依然是高度結構化且零散的,無法覆蓋我們日常生活中那些瑣碎、真實、卻至關重要的細節。
而且更關鍵的是,這種信息獲取是被動的,需要用戶主動喚起,但用戶不可能永遠有空去在重要時刻喚起它。這樣的信息量,不足以訓練出一個真正懂你的個人AI。
Looki選擇的這個硬體形式,提供了全天候靜默採集系統的基礎。它會定時捕捉你看到的畫面和聲音,為AI提供了理解用戶的完整的細節「劇本」。
在當前的版本中,Looki會利用雲端AI對這些數據進行處理。在手機App中,AI會自動將一天記錄的碎片按語義分割成不同的「moments」(時刻),並打上「邊開車邊吃早餐」、「專註工作」、「吃麵條午餐」等標籤。
基於這種理解,系統還會在」for
you「這個板塊自動生成vlog短片,提取一天中的高光時刻,進行智能剪輯、配上AI生成的背景音樂,並\”所有的剪輯、音樂都是AI生成的,\”孫洋介紹,\”用戶完全不需要後期製作。\”
但這只是第一步。其更深層的能力,是構建了一個基於個人生活數據的AI記憶系統。用戶可以像與ChatGPT對話一樣,詢問關於自己生活的任何問題,比如「我昨天攝入了多少卡路里?」或「我上周去了哪些地方?」
在騰訊科技的實測中,戴著Looki三天後,Looki能夠幫用戶總結和歸納自己看到的和感受到的一切,還可以精準的幫助用戶回憶起生活的細節。
當回看時,彷彿有第三隻眼睛陪伴著用戶,一起觀察和感知著這個世界。
個人AI的信息採集思路其實很簡單,就是由硬體採集數據,然後AI進行理解分析、並抽象儲存。但其實工程的實踐中面臨了很多困難。
過去也有很多複雜記憶架構的應用,但問題也很多:理解不夠準確,處理不夠高效,或者處理成本過高。
而Looki的主要護城河,就是構建了一套足夠穩定的記憶系統。這套架構基於GPT-4V等多模態大模型,Looki形成了一套複雜的記憶系統架構,其複雜性遠超簡單的RAG(檢索增強生成),類似於MemeoryOS的水平。
第一道難關,準確性。
相比那些允許用戶上傳任意格式數據(聊天記錄、視頻等)的記憶類產品,Looki的數據都來自同一設備、同一模態。而且任務域也基本限於日常生活。在提供給我們展示中,幾乎沒有具體的工作場景細節。這樣,處理域簡單、處理方式統一,Looki的記憶體系效果就會更穩定、準確性也更高。
而為了解決多模態分析的高昂成本,Looki採用了抽幀語義理解的預處理架構,將計算密集型的視頻理解前置到數據上傳階段,從而大幅降低了後續查詢的延遲和成本。
這種「記錄-理解-查詢」的模式,是通向個人AI的第一步。
更重要的下一步,是讓AI具備主動判斷和預測的能力。
這一點,Looki計劃在下一代產品中逐步加入和完善,例如基於位置和場景的智能提醒。
而這,也恰恰是谷歌Project
Astra仍在演示階段,尚未能大規模產品化的核心原因,當下的AI技術,在「主動性」和「可靠性」上,顯然還未完全成熟。
03 除了記錄,更重要的是幫助用戶節省剪輯的時間
既然個人AI的終極形態尚需時日,且當前實現的「記憶系統」其穩定性也需要持續的工程優化,那麼直接將「個人化AI」作為核心賣點,無疑風險巨大。AI
Pin等前輩的失敗,很大程度上就是因為畫的「餅」太大,而實際體驗卻無法跟上,導致用戶期望落空。
Looki吸取了這些教訓,選擇了一條更謹慎、更務實的市場策略。它沒有和Sein 與Friend
AI一樣高舉高打地宣傳自己是「你的AI大腦」或「生活操作系統」,而是將自己定位為一個更容易被大眾理解的角色,對標影石(Insta360)的「智能運動相機」。
「自動剪輯」、「智能生成Vlog」,這些功能描述具體而清晰。它精準地切入了那些對生活記錄有明確需求,但又被傳統拍攝和複雜後期流程所困擾的用戶群體:希望記錄孩子成長的父母、需要大量素材的短視頻創作者、熱愛分享的旅遊和戶外運動愛好者。
孫洋解釋道,傳統方式拍完素材回家後,用剪映等工具編輯至少需要半小時到一小時,而Looki讓用戶只管拍攝,AI自動處理,用戶只需查看結果即可。
這種定位,既讓Looki成功地與Insta360、大疆等傳統運動相機形成了差異化競爭。又這讓產品有了一個清晰的價值主張,避免了像Friend
AI那樣,因過於強調模糊的「AI陪伴」概念而導致用戶定位不清的窘境。
04 記憶,正在成為AI應用的新風口
Looki的選擇,不僅是創業公司的生存策略,更在底層順應了AI應用發展的一大趨勢。
為了實現個人AI,知名風險投資機構BVP在其年度AI報告中明確指出,Memory(記憶)和Context(上下文)將成為新的護城河。
他們認為,應該將記憶看作是一種產品,而不是一種單純的後端技術。那些能將記憶作為產品核心來構建的公司,將能定義下一代更智能、更個性化的AI系統。
在這一浪潮下,無論是Looki,還是其他類似的探索者,都是最先下水感受水溫的人。當谷歌和OpenAI還在準備他們的「航空母艦」時,這些「小艇」能否憑藉先發優勢,像Manus等產品一樣,通過快速迭代的產品和獨特的體驗,提前搶佔用戶心智?
這並非完全不可能。在Cahtbot時代,用戶的需求太過多樣縹緲,很難形成需求飛輪。但對於一個記錄生活的產品來講,用戶的需求點可能更明確,這時候數據的價值可能更大。
不過作為一個經常丟三落四的人,如果Looki真的能夠像PPT里宣傳的,可以幫我找到我落在角落裡的鑰匙。那它對我來講就確實是能俘獲我心智的剛需產品了。