當前位置：首頁 > 資訊

北京AI破壁之路端側小模型跑出大能量

時間：2025-06-16 10:31:30 北京日報 1

在清華科技園科建大廈3樓，面壁智能聯合創始人、CEO李大海的辦公室中央掛著一幅大型拼圖，一艘船在風雨中劈波斬浪。

今年已是李大海來到中關村的第23年。

2006年，從北京大學數學系畢業后，李大海加入谷歌中國，成為創始員工之一。后來他又參與了云云網、豌豆莢、知乎的創業。2023年，一場大模型掀起的技術風暴席卷而來，時任知乎CTO的李大海決定投身其中。當年4月，在李大海的推動下，知乎完成了對面壁智能的獨家天使輪投資。

李大海看好面壁智能，是因為其創始人、青年科學家劉知遠是國內首批開展大模型研究的研究者之一。2020年12月，劉知遠團隊發布了全球第一個中文開源大模型“CPM”，這一項目也是后來中國奠基性大模型“悟道”的前身。兩年后，劉知遠發起成立面壁智能。

投資一家優秀的大模型企業，對李大海來說絕非終點。大模型掀起的洶涌浪潮讓他興奮得難以入睡。“這是一場堪比蒸汽機改變世界的大變革！”一次次在深夜爬起來看代碼、追蹤大模型前沿進展的李大海，決定從大廠高管轉身，再次創業。2023年6月，李大海出任面壁智能CEO。

彼時，大模型領域激戰正酣，一場前所未有的“百模大戰”正在上演。與此同時，隨著大模型迅猛發展，作為大模型“燃料”的算力告急，行業內出現GPU“一卡難求”“排隊預定”的局面。如何才能從白熱化的競爭中殺出重圍？

高效——是李大海與團隊給出的答案。“與其盲目地把模型做大，不如花更多精力讓模型變好，以同樣的模型參數量實現更高的智能與知識密度。”基于對大模型本質規律的觀察，他們提出了大模型的密度定律（DensingLaw）：大模型知識密度每3.3個月翻一番，大模型將變得越來越“小”，同時能力越來越強。

基于這一理念，團隊選擇避開同質化嚴重的對話式AI聊天機器人，將視野轉向了一個在當時看來不算熱門的方向——端側大模型。李大海認為，人們的生活早已離不開手機、平板、汽車等各種各樣的硬件終端設備，而在不久的將來，這些智能終端都將擁有具備自主思考能力的“超級大腦”。

“我們要讓小模型跑出大能量，讓本地模型能力滿足日常絕大多數的智能需求。”李大海堅信，相比于時下最火熱的跑在“云”上，并且需要大量算力的千億級超大模型，在“斷網、弱網”環境下，仍然能讓各種智能終端具備自主思考能力的端側大模型，將成為面壁獨特的競爭力。

用更小的參數、更高的效率、更低的成本，實現更好的智能——達到這個目標，并不容易。“模型能力日新月異，但模型效率的領先如同芯片制程一般，須形成比較硬的相對優勢。我們要攻克的，就好比大模型行業的‘光刻機’。”李大海說。

拿算法來說，過去，由于模型訓練過程中充滿不確定性，傳統的大模型訓練被業界戲稱為“煉丹”。而面壁研發團隊通過上千次模型沙盒實驗，在算法的各種細節上摸索出了一系列最優配置，大幅優化了模型效果。

為了打磨大模型“光刻機”，從高質量的數據原材料，到模型訓練與調校，一個個環環相扣的細節，研發人員都細細打磨。2024年初，面壁推出了端側大模型MiniCPM，用僅僅24億參數實現了超過百億參數大模型的性能。

“超級大腦”仍在不斷進化。今年1月，面壁智能發布MiniCPM-o2，這也是全球首個達到OpenAI公司GPT-4o水平的端側多模態大模型。這款僅有80億參數量的模型，能夠實時流式處理文本、圖像、音頻和視頻信息，“視、聽、說”都很伶俐。

在今年中關村論壇年會期間，面壁又發布了一項領先業界的成果——首個純端側超級智能助手，可應用于汽車智能座艙。在端側大模型的支撐下，即便車輛沒有網絡，超級智能助手也能隨時“在線”，實現從車外到車內的各種感知并執行任務。

由于在安全性、實時性等方面的巨大優勢，面壁的端側模型一經推出就很快獲得了法律、消費電子等行業用戶的認可。就在上月，面壁與合作伙伴發布了首個純端側大模型量產車型。

“2026年，裝上面壁端側模型的設備數將達2025年的10倍。”放眼未來，李大海的眼中是更廣闊的星辰大海——未來全球將有400億的設備終端，它們都有望裝上一個個“超級大腦”。

獨角獸“秘笈”

冷靜取舍以小博大

智譜、月之暗面、百川智能、零一萬物、面壁智能……在今年年初第三方機構公布的國內大模型獨角獸排行榜中，多家北京企業赫然在列，顯示出創新資源高度集聚的效應。

在被人們稱為“宇宙中心”的五道口一帶，辦公租金并不便宜，李大海坦言，背靠五道口周邊極強的人才優勢，是成立僅三年的面壁得以迅猛發展的重要原因。

身處北京，依靠全國領先的AI人才資源和“AI第一城”的創新生態，與行業巨頭憑借巨額資金和海量算力投入“大力出奇跡”的發展路徑不同，以面壁為代表的北京人工智能初創企業，向世界展現出高效創新、“以小博大”的創新范式。

“對創業公司來說，‘不做什么’和‘做什么’都很重要，‘不做什么’甚至更重要。”李大海說。面對巨大機遇，創業公司需要注意的是“專注一個點做透”，并在此過程中不斷辨別哪些是應勇于“取”的機遇，哪些是要勇于“舍”的誘惑。在“大煉模型”的風潮下，面壁就曾先后做出不做AI聊天機器人、放棄大模型基礎設施等重要決策，專注打磨端側模型，提升模型效率與知識密度，“以小博大”。

蛇年春節，DeepSeek旋風席卷全球。以低成本實現高性能，正是DeepSeek一鳴驚人之處。《麻省理工科技評論》隨后刊發了一篇題為《關注DeepSeek之外的四家中國人工智能初創公司》的報道，點贊中國“四劍客”，其中就有面壁智能。

勇于面壁，方能破壁——Deep-Seek和面壁智能，都在用實際行動印證著一個道理，不盲目跟風，勇于探索新路徑，即便在有限的資源環境下也能激發、倒逼出無限的創新潛力。

在清華科技園科建大廈3樓，面壁智能聯合創始人、CEO李大海的辦公室中央掛著一幅大型拼圖，一艘船在風雨中劈波斬浪。

今年已是李大海來到中關村的第23年。