在清華科技園科建大廈3樓,面壁智能聯合創始人、CEO李大海的辦公室中央掛著一幅大型拼圖,一艘船在風雨中劈波斬浪。
今年已是李大海來到中關村的第23年。
2006年,從北京大學數學系畢業后,李大海加入谷歌中國,成為創始員工之一。后來他又參與了云云網、豌豆莢、知乎的創業。2023年,一場大模型掀起的技術風暴席卷而來,時任知乎CTO的李大海決定投身其中。當年4月,在李大海的推動下,知乎完成了對面壁智能的獨家天使輪投資。
李大海看好面壁智能,是因為其創始人、青年科學家劉知遠是國內首批開展大模型研究的研究者之一。2020年12月,劉知遠團隊發布了全球第一個中文開源大模型“CPM”,這一項目也是后來中國奠基性大模型“悟道”的前身。兩年后,劉知遠發起成立面壁智能。
投資一家優秀的大模型企業,對李大海來說絕非終點。大模型掀起的洶涌浪潮讓他興奮得難以入睡。“這是一場堪比蒸汽機改變世界的大變革!”一次次在深夜爬起來看代碼、追蹤大模型前沿進展的李大海,決定從大廠高管轉身,再次創業。2023年6月,李大海出任面壁智能CEO。
彼時,大模型領域激戰正酣,一場前所未有的“百模大戰”正在上演。與此同時,隨著大模型迅猛發展,作為大模型“燃料”的算力告急,行業內出現GPU“一卡難求”“排隊預定”的局面。如何才能從白熱化的競爭中殺出重圍?
高效——是李大海與團隊給出的答案。“與其盲目地把模型做大,不如花更多精力讓模型變好,以同樣的模型參數量實現更高的智能與知識密度。”基于對大模型本質規律的觀察,他們提出了大模型的密度定律(DensingLaw):大模型知識密度每3.3個月翻一番,大模型將變得越來越“小”,同時能力越來越強。
基于這一理念,團隊選擇避開同質化嚴重的對話式AI聊天機器人,將視野轉向了一個在當時看來不算熱門的方向——端側大模型。李大海認為,人們的生活早已離不開手機、平板、汽車等各種各樣的硬件終端設備,而在不久的將來,這些智能終端都將擁有具備自主思考能力的“超級大腦”。
“我們要讓小模型跑出大能量,讓本地模型能力滿足日常絕大多數的智能需求。”李大海堅信,相比于時下最火熱的跑在“云”上,并且需要大量算力的千億級超大模型,在“斷網、弱網”環境下,仍然能讓各種智能終端具備自主思考能力的端側大模型,將成為面壁獨特的競爭力。
用更小的參數、更高的效率、更低的成本,實現更好的智能——達到這個目標,并不容易。“模型能力日新月異,但模型效率的領先如同芯片制程一般,須形成比較硬的相對優勢。我們要攻克的,就好比大模型行業的‘光刻機’。”李大海說。
拿算法來說,過去,由于模型訓練過程中充滿不確定性,傳統的大模型訓練被業界戲稱為“煉丹”。而面壁研發團隊通過上千次模型沙盒實驗,在算法的各種細節上摸索出了一系列最優配置,大幅優化了模型效果。
為了打磨大模型“光刻機”,從高質量的數據原材料,到模型訓練與調校,一個個環環相扣的細節,研發人員都細細打磨。2024年初,面壁推出了端側大模型MiniCPM,用僅僅24億參數實現了超過百億參數大模型的性能。
“超級大腦”仍在不斷進化。今年1月,面壁智能發布MiniCPM-o2,這也是全球首個達到OpenAI公司GPT-4o水平的端側多模態大模型。這款僅有80億參數量的模型,能夠實時流式處理文本、圖像、音頻和視頻信息,“視、聽、說”都很伶俐。
在今年中關村論壇年會期間,面壁又發布了一項領先業界的成果——首個純端側超級智能助手,可應用于汽車智能座艙。在端側大模型的支撐下,即便車輛沒有網絡,超級智能助手也能隨時“在線”,實現從車外到車內的各種感知并執行任務。
由于在安全性、實時性等方面的巨大優勢,面壁的端側模型一經推出就很快獲得了法律、消費電子等行業用戶的認可。就在上月,面壁與合作伙伴發布了首個純端側大模型量產車型。
“2026年,裝上面壁端側模型的設備數將達2025年的10倍。”放眼未來,李大海的眼中是更廣闊的星辰大海——未來全球將有400億的設備終端,它們都有望裝上一個個“超級大腦”。
獨角獸“秘笈”
冷靜取舍 以小博大
智譜、月之暗面、百川智能、零一萬物、面壁智能……在今年年初第三方機構公布的國內大模型獨角獸排行榜中,多家北京企業赫然在列,顯示出創新資源高度集聚的效應。
在被人們稱為“宇宙中心”的五道口一帶,辦公租金并不便宜,李大海坦言,背靠五道口周邊極強的人才優勢,是成立僅三年的面壁得以迅猛發展的重要原因。
身處北京,依靠全國領先的AI人才資源和“AI第一城”的創新生態,與行業巨頭憑借巨額資金和海量算力投入“大力出奇跡”的發展路徑不同,以面壁為代表的北京人工智能初創企業,向世界展現出高效創新、“以小博大”的創新范式。
“對創業公司來說,‘不做什么’和‘做什么’都很重要,‘不做什么’甚至更重要。”李大海說。面對巨大機遇,創業公司需要注意的是“專注一個點做透”,并在此過程中不斷辨別哪些是應勇于“取”的機遇,哪些是要勇于“舍”的誘惑。在“大煉模型”的風潮下,面壁就曾先后做出不做AI聊天機器人、放棄大模型基礎設施等重要決策,專注打磨端側模型,提升模型效率與知識密度,“以小博大”。
蛇年春節,DeepSeek旋風席卷全球。以低成本實現高性能,正是DeepSeek一鳴驚人之處。《麻省理工科技評論》隨后刊發了一篇題為《關注DeepSeek之外的四家中國人工智能初創公司》的報道,點贊中國“四劍客”,其中就有面壁智能。
勇于面壁,方能破壁——Deep-Seek和面壁智能,都在用實際行動印證著一個道理,不盲目跟風,勇于探索新路徑,即便在有限的資源環境下也能激發、倒逼出無限的創新潛力。
在清華科技園科建大廈3樓,面壁智能聯合創始人、CEO李大海的辦公室中央掛著一幅大型拼圖,一艘船在風雨中劈波斬浪。
今年已是李大海來到中關村的第23年。
2006年,從北京大學數學系畢業后,李大海加入谷歌中國,成為創始員工之一。后來他又參與了云云網、豌豆莢、知乎的創業。2023年,一場大模型掀起的技術風暴席卷而來,時任知乎CTO的李大海決定投身其中。當年4月,在李大海的推動下,知乎完成了對面壁智能的獨家天使輪投資。
李大海看好面壁智能,是因為其創始人、青年科學家劉知遠是國內首批開展大模型研究的研究者之一。2020年12月,劉知遠團隊發布了全球第一個中文開源大模型“CPM”,這一項目也是后來中國奠基性大模型“悟道”的前身。兩年后,劉知遠發起成立面壁智能。
投資一家優秀的大模型企業,對李大海來說絕非終點。大模型掀起的洶涌浪潮讓他興奮得難以入睡。“這是一場堪比蒸汽機改變世界的大變革!”一次次在深夜爬起來看代碼、追蹤大模型前沿進展的李大海,決定從大廠高管轉身,再次創業。2023年6月,李大海出任面壁智能CEO。
彼時,大模型領域激戰正酣,一場前所未有的“百模大戰”正在上演。與此同時,隨著大模型迅猛發展,作為大模型“燃料”的算力告急,行業內出現GPU“一卡難求”“排隊預定”的局面。如何才能從白熱化的競爭中殺出重圍?
高效——是李大海與團隊給出的答案。“與其盲目地把模型做大,不如花更多精力讓模型變好,以同樣的模型參數量實現更高的智能與知識密度。”基于對大模型本質規律的觀察,他們提出了大模型的密度定律(DensingLaw):大模型知識密度每3.3個月翻一番,大模型將變得越來越“小”,同時能力越來越強。
基于這一理念,團隊選擇避開同質化嚴重的對話式AI聊天機器人,將視野轉向了一個在當時看來不算熱門的方向——端側大模型。李大海認為,人們的生活早已離不開手機、平板、汽車等各種各樣的硬件終端設備,而在不久的將來,這些智能終端都將擁有具備自主思考能力的“超級大腦”。
“我們要讓小模型跑出大能量,讓本地模型能力滿足日常絕大多數的智能需求。”李大海堅信,相比于時下最火熱的跑在“云”上,并且需要大量算力的千億級超大模型,在“斷網、弱網”環境下,仍然能讓各種智能終端具備自主思考能力的端側大模型,將成為面壁獨特的競爭力。
用更小的參數、更高的效率、更低的成本,實現更好的智能——達到這個目標,并不容易。“模型能力日新月異,但模型效率的領先如同芯片制程一般,須形成比較硬的相對優勢。我們要攻克的,就好比大模型行業的‘光刻機’。”李大海說。
拿算法來說,過去,由于模型訓練過程中充滿不確定性,傳統的大模型訓練被業界戲稱為“煉丹”。而面壁研發團隊通過上千次模型沙盒實驗,在算法的各種細節上摸索出了一系列最優配置,大幅優化了模型效果。
為了打磨大模型“光刻機”,從高質量的數據原材料,到模型訓練與調校,一個個環環相扣的細節,研發人員都細細打磨。2024年初,面壁推出了端側大模型MiniCPM,用僅僅24億參數實現了超過百億參數大模型的性能。
“超級大腦”仍在不斷進化。今年1月,面壁智能發布MiniCPM-o2,這也是全球首個達到OpenAI公司GPT-4o水平的端側多模態大模型。這款僅有80億參數量的模型,能夠實時流式處理文本、圖像、音頻和視頻信息,“視、聽、說”都很伶俐。
在今年中關村論壇年會期間,面壁又發布了一項領先業界的成果——首個純端側超級智能助手,可應用于汽車智能座艙。在端側大模型的支撐下,即便車輛沒有網絡,超級智能助手也能隨時“在線”,實現從車外到車內的各種感知并執行任務。
由于在安全性、實時性等方面的巨大優勢,面壁的端側模型一經推出就很快獲得了法律、消費電子等行業用戶的認可。就在上月,面壁與合作伙伴發布了首個純端側大模型量產車型。
“2026年,裝上面壁端側模型的設備數將達2025年的10倍。”放眼未來,李大海的眼中是更廣闊的星辰大海——未來全球將有400億的設備終端,它們都有望裝上一個個“超級大腦”。
獨角獸“秘笈”
冷靜取舍 以小博大
智譜、月之暗面、百川智能、零一萬物、面壁智能……在今年年初第三方機構公布的國內大模型獨角獸排行榜中,多家北京企業赫然在列,顯示出創新資源高度集聚的效應。
在被人們稱為“宇宙中心”的五道口一帶,辦公租金并不便宜,李大海坦言,背靠五道口周邊極強的人才優勢,是成立僅三年的面壁得以迅猛發展的重要原因。
身處北京,依靠全國領先的AI人才資源和“AI第一城”的創新生態,與行業巨頭憑借巨額資金和海量算力投入“大力出奇跡”的發展路徑不同,以面壁為代表的北京人工智能初創企業,向世界展現出高效創新、“以小博大”的創新范式。
“對創業公司來說,‘不做什么’和‘做什么’都很重要,‘不做什么’甚至更重要。”李大海說。面對巨大機遇,創業公司需要注意的是“專注一個點做透”,并在此過程中不斷辨別哪些是應勇于“取”的機遇,哪些是要勇于“舍”的誘惑。在“大煉模型”的風潮下,面壁就曾先后做出不做AI聊天機器人、放棄大模型基礎設施等重要決策,專注打磨端側模型,提升模型效率與知識密度,“以小博大”。
蛇年春節,DeepSeek旋風席卷全球。以低成本實現高性能,正是DeepSeek一鳴驚人之處。《麻省理工科技評論》隨后刊發了一篇題為《關注DeepSeek之外的四家中國人工智能初創公司》的報道,點贊中國“四劍客”,其中就有面壁智能。
勇于面壁,方能破壁——Deep-Seek和面壁智能,都在用實際行動印證著一個道理,不盲目跟風,勇于探索新路徑,即便在有限的資源環境下也能激發、倒逼出無限的創新潛力。
本文鏈接:http://www.svtrjb.com/v-146-1969.html北京AI破壁之路 端側小模型跑出大能量
相關文章:
描寫心情的句子12-10
公司會計文員工作總結08-23
跟蹤審計總結報告范文8篇08-15
經典誦讀活動計劃07-07
中學生違紀保證書01-07
上課睡覺的保證書12-16
私募基金托管協議07-16
湘西鳳凰導游詞08-15
電話銷售培訓心得體會07-26
高考語文明清文學常識知識點復習02-12
一幅最美的風景小學生作文01-13
鄱陽湖游記作文01-13
高三學生描寫月夜思鄉作文12-17
金陵科技學院哪個專業好就業01-24
人類在太空里生孩子有可能嗎? - 知乎01-13
2024荊州學院在湖南怎么招生的11-23
暑假安全班會教案10-16
初中班主任評語24篇10-05
眼鏡廣告文案02-19