2024年春的一天,美國斯坦福大學病理學家托馬斯·蒙廷開啟了一場前所未有的“實驗室會議”——與6位由人工智能(AI)驅(qū)動的“虛擬科學家”共商阿爾茨海默病的治療策略。這些AI被賦予不同的專業(yè)角色,從神經(jīng)科學家到藥物化學家,在幾分鐘內(nèi)展開多輪討論,最終生成了一份長達一萬多字的會議紀要。這場看似科幻的情景,其實是一個新興趨勢的縮影:以多智能體語言模型組成“AI科研團隊”,模擬真實研究協(xié)作過程,幫助科學家節(jié)省時間、完善假設,甚至激發(fā)新的科學靈感。開發(fā)者稱這種系統(tǒng)為“聯(lián)合科學家”。
多家機構(gòu)打造“虛擬實驗室”
今年2月,谷歌旗下“深度思維”公司推出了一款名為“AI聯(lián)合科學家”的軟件。該軟件由6個AI代理組成,分別負責想法生成、反思或批評、概念演進、去重、排序和總結(jié)審稿,均由谷歌的Gemini 2.0模型驅(qū)動。這套系統(tǒng)是谷歌生物醫(yī)學AI研究工作的延伸。在一項早期測試中,該系統(tǒng)在兩天內(nèi)就解決了困擾科學家十多年的科學謎題。
美國斯坦福大學也在去年11月推出了“虛擬實驗室”系統(tǒng),蒙廷試用的正是這個版本??萍济襟wFreethink網(wǎng)站報道稱,目前,該系統(tǒng)以OpenAI的GPT-4o為基礎,默認配備“首席研究員”和“評論者”兩個角色,用戶可自由添加更多代理并設定他們的專業(yè)領域,快速生成模擬會議記錄。
在中國,上海人工智能實驗室的研究團隊也在開發(fā)虛擬科學家系統(tǒng),名為“VirSci”,專注于模擬科學家團隊的合作過程,以推動科研創(chuàng)新。
英國《自然》雜志報道稱,這些系統(tǒng)所用的大型語言模型(LLM)不僅僅是在“你一言我一語”地交換觀點,它們還具備聯(lián)網(wǎng)檢索信息、執(zhí)行代碼、調(diào)用專業(yè)工具等功能,屬于一種“代理式AI”系統(tǒng)。這一術(shù)語目前尚不嚴格,但一般指LLM在一定程度上能自主承擔任務。美國阿貢國家實驗室的計算機科學家里克·史蒂文斯指出,多個AI代理協(xié)同作戰(zhàn),可連續(xù)數(shù)小時專注于解決復雜科學問題,不會走神,也不會疲憊。
AI科研團隊是否靠譜
那么問題來了:這些AI之間的對話,像是一屋子的諾貝爾獎得主,還是一群本科生?它們的想法是天方夜譚、空洞無趣,還是令人振奮、值得深挖?
現(xiàn)階段的AI代理系統(tǒng)確實存在“幻覺”問題,即生成錯誤或虛構(gòu)的信息。但芝加哥大學計算機科學家史蒂文斯指出,通過引入“評論者”或“評審者”的角色,系統(tǒng)往往能有效篩除不合理內(nèi)容,提升整體可靠性。他還認為,即便是“幻覺”,在頭腦風暴場景下也可能激發(fā)出意想不到的創(chuàng)意,前提是有專家把關(guān)。
現(xiàn)有研究也發(fā)現(xiàn),多代理協(xié)作確實優(yōu)于單一AI。以GPT-4o為例,斯坦福大學團隊發(fā)現(xiàn),若在對話中加入一名“評論者”,該模型在研究生水平的科學測試中的表現(xiàn)會提高幾個百分點,在實際科研應用中的回答也更加精準,例如在放射治療方案設計方面更具邏輯。
谷歌也曾對其聯(lián)合科學家系統(tǒng)展開評估,結(jié)果顯示,人類專家更傾向于由多個AI協(xié)作生成的回答,認為其更具新意和科研潛力。
關(guān)于多少名AI代理、幾輪互動最為有效,科學界也正在尋找答案。上海人工智能實驗室計算機科學家董楠卿等人開發(fā)VirSci系統(tǒng)時發(fā)現(xiàn),最佳創(chuàng)造力出現(xiàn)在“8個代理人×每人5輪發(fā)言”的設置下。而斯坦福大學的斯旺森則表示,超過3個專家后輸出常常變得冗余,3輪之后系統(tǒng)也容易跑題。
AI的點子到底有多新
谷歌在宣布其聯(lián)合科學家系統(tǒng)時表示,該系統(tǒng)幫助研究者提出了“新穎的預測”。例如,斯坦福大學的加里·佩爾茨用谷歌的“AI聯(lián)合科學家”系統(tǒng)尋找治療肝纖維化的新藥時,AI團隊在分析背景信息后提出3種藥物建議,其中2種在實驗中顯示出療效,反而優(yōu)于他自己挑選的方案。但同時,一些科學家則認為這些建議其實“談不上什么新意”。
類似的爭議也出現(xiàn)在帝國理工學院微生物學家何塞·佩納德斯團隊測試谷歌系統(tǒng)時。AI在閱讀背景文獻后,提出了一種未見于任何文獻的新假設:移動遺傳元件可“跨細胞偷取”噬菌體尾部。這一觀點挑戰(zhàn)主流,卻與該團隊通過未公開實驗得出的結(jié)論一致。佩納德斯認為,盡管AI只是把已有信息作了一個“顯而易見”的推理,但其本身就是科學進步。
《自然》雜志指出,這類AI系統(tǒng)目前更像是一種科研助理:它們通過總結(jié)資料、激發(fā)靈感、提出新角度或查漏補缺,幫助研究者節(jié)省時間,提高效率。但是否能催生真正顛覆性的想法,還需長期驗證。
目前,這類多智能體語言模型系統(tǒng)尚未以大眾化、便捷的方式廣泛提供。但研究人員普遍認為,AI聯(lián)合科學家終將成為科研日常的一部分,就像搜索引擎一樣,不過這并不意味著它能取代人類。史蒂文斯提醒,如果年輕科研人員過度依賴AI,可能會損害其自主思考和學習能力。西班牙癌癥研究者巴里加也表示,過度依賴AI,就如同把思考過程“外包”,而那正是科研中最有趣的部分。
2024年春的一天,美國斯坦福大學病理學家托馬斯·蒙廷開啟了一場前所未有的“實驗室會議”——與6位由人工智能(AI)驅(qū)動的“虛擬科學家”共商阿爾茨海默病的治療策略。這些AI被賦予不同的專業(yè)角色,從神經(jīng)科學家到藥物化學家,在幾分鐘內(nèi)展開多輪討論,最終生成了一份長達一萬多字的會議紀要。這場看似科幻的情景,其實是一個新興趨勢的縮影:以多智能體語言模型組成“AI科研團隊”,模擬真實研究協(xié)作過程,幫助科學家節(jié)省時間、完善假設,甚至激發(fā)新的科學靈感。開發(fā)者稱這種系統(tǒng)為“聯(lián)合科學家”。
多家機構(gòu)打造“虛擬實驗室”
今年2月,谷歌旗下“深度思維”公司推出了一款名為“AI聯(lián)合科學家”的軟件。該軟件由6個AI代理組成,分別負責想法生成、反思或批評、概念演進、去重、排序和總結(jié)審稿,均由谷歌的Gemini 2.0模型驅(qū)動。這套系統(tǒng)是谷歌生物醫(yī)學AI研究工作的延伸。在一項早期測試中,該系統(tǒng)在兩天內(nèi)就解決了困擾科學家十多年的科學謎題。
美國斯坦福大學也在去年11月推出了“虛擬實驗室”系統(tǒng),蒙廷試用的正是這個版本。科技媒體Freethink網(wǎng)站報道稱,目前,該系統(tǒng)以OpenAI的GPT-4o為基礎,默認配備“首席研究員”和“評論者”兩個角色,用戶可自由添加更多代理并設定他們的專業(yè)領域,快速生成模擬會議記錄。
在中國,上海人工智能實驗室的研究團隊也在開發(fā)虛擬科學家系統(tǒng),名為“VirSci”,專注于模擬科學家團隊的合作過程,以推動科研創(chuàng)新。
英國《自然》雜志報道稱,這些系統(tǒng)所用的大型語言模型(LLM)不僅僅是在“你一言我一語”地交換觀點,它們還具備聯(lián)網(wǎng)檢索信息、執(zhí)行代碼、調(diào)用專業(yè)工具等功能,屬于一種“代理式AI”系統(tǒng)。這一術(shù)語目前尚不嚴格,但一般指LLM在一定程度上能自主承擔任務。美國阿貢國家實驗室的計算機科學家里克·史蒂文斯指出,多個AI代理協(xié)同作戰(zhàn),可連續(xù)數(shù)小時專注于解決復雜科學問題,不會走神,也不會疲憊。
AI科研團隊是否靠譜
那么問題來了:這些AI之間的對話,像是一屋子的諾貝爾獎得主,還是一群本科生?它們的想法是天方夜譚、空洞無趣,還是令人振奮、值得深挖?
現(xiàn)階段的AI代理系統(tǒng)確實存在“幻覺”問題,即生成錯誤或虛構(gòu)的信息。但芝加哥大學計算機科學家史蒂文斯指出,通過引入“評論者”或“評審者”的角色,系統(tǒng)往往能有效篩除不合理內(nèi)容,提升整體可靠性。他還認為,即便是“幻覺”,在頭腦風暴場景下也可能激發(fā)出意想不到的創(chuàng)意,前提是有專家把關(guān)。
現(xiàn)有研究也發(fā)現(xiàn),多代理協(xié)作確實優(yōu)于單一AI。以GPT-4o為例,斯坦福大學團隊發(fā)現(xiàn),若在對話中加入一名“評論者”,該模型在研究生水平的科學測試中的表現(xiàn)會提高幾個百分點,在實際科研應用中的回答也更加精準,例如在放射治療方案設計方面更具邏輯。
谷歌也曾對其聯(lián)合科學家系統(tǒng)展開評估,結(jié)果顯示,人類專家更傾向于由多個AI協(xié)作生成的回答,認為其更具新意和科研潛力。
關(guān)于多少名AI代理、幾輪互動最為有效,科學界也正在尋找答案。上海人工智能實驗室計算機科學家董楠卿等人開發(fā)VirSci系統(tǒng)時發(fā)現(xiàn),最佳創(chuàng)造力出現(xiàn)在“8個代理人×每人5輪發(fā)言”的設置下。而斯坦福大學的斯旺森則表示,超過3個專家后輸出常常變得冗余,3輪之后系統(tǒng)也容易跑題。
AI的點子到底有多新
谷歌在宣布其聯(lián)合科學家系統(tǒng)時表示,該系統(tǒng)幫助研究者提出了“新穎的預測”。例如,斯坦福大學的加里·佩爾茨用谷歌的“AI聯(lián)合科學家”系統(tǒng)尋找治療肝纖維化的新藥時,AI團隊在分析背景信息后提出3種藥物建議,其中2種在實驗中顯示出療效,反而優(yōu)于他自己挑選的方案。但同時,一些科學家則認為這些建議其實“談不上什么新意”。
類似的爭議也出現(xiàn)在帝國理工學院微生物學家何塞·佩納德斯團隊測試谷歌系統(tǒng)時。AI在閱讀背景文獻后,提出了一種未見于任何文獻的新假設:移動遺傳元件可“跨細胞偷取”噬菌體尾部。這一觀點挑戰(zhàn)主流,卻與該團隊通過未公開實驗得出的結(jié)論一致。佩納德斯認為,盡管AI只是把已有信息作了一個“顯而易見”的推理,但其本身就是科學進步。
《自然》雜志指出,這類AI系統(tǒng)目前更像是一種科研助理:它們通過總結(jié)資料、激發(fā)靈感、提出新角度或查漏補缺,幫助研究者節(jié)省時間,提高效率。但是否能催生真正顛覆性的想法,還需長期驗證。
目前,這類多智能體語言模型系統(tǒng)尚未以大眾化、便捷的方式廣泛提供。但研究人員普遍認為,AI聯(lián)合科學家終將成為科研日常的一部分,就像搜索引擎一樣,不過這并不意味著它能取代人類。史蒂文斯提醒,如果年輕科研人員過度依賴AI,可能會損害其自主思考和學習能力。西班牙癌癥研究者巴里加也表示,過度依賴AI,就如同把思考過程“外包”,而那正是科研中最有趣的部分。
本文鏈接:http://www.svtrjb.com/v-146-3221.html創(chuàng)新藥如何不再“用藥難”
相關(guān)文章:
AI賦能“兩輪制造”,中國自行車產(chǎn)業(yè)駛?cè)霐?shù)字化“新賽道”05-26
去醫(yī)院檢查身體的朋友圈說說05-08
好詞好句摘抄08-02
財務工作人員工作總結(jié)(十七篇)10-17
村級財務工作總結(jié) 村財務年終總結(jié)(八篇)08-15
最新煤礦技術(shù)員個人年度工作總結(jié)(7篇)08-09
大學生面試求職信01-19
男朋友保證書01-12
小學元旦晚會策劃書11-30
農(nóng)村家庭貧困貧困證明08-31
童年讀后感08-23
四年級家長會學好英語的發(fā)言稿07-20
校園環(huán)保的建議書01-09
寫秋天景色的作文10-19
成長的快樂作文六年級08-17
小學作文秋天的童話08-10
2024年海南執(zhí)業(yè)藥師考試合格分數(shù)線公布01-07
大四學生社會實踐報告09-27