隨著人工智能大模型的不斷發(fā)展,如何讓其在“難”的問題上深入思考,而不是對(duì)所有問題“想個(gè)不停”?記者5月29日從中國(guó)科學(xué)院自動(dòng)化研究所獲悉,該所聯(lián)合鵬城實(shí)驗(yàn)室提出了一種高效推理策略AutoThink,可讓大模型實(shí)現(xiàn)自主切換思考模式,避免“過度思考”。
“當(dāng)前,越來越多的大模型開始具備‘深度思考能力’。”中國(guó)科學(xué)院自動(dòng)化研究所研究員張啟超說,模型在回答問題之前要先生成一整段包含反復(fù)自我反思、自我驗(yàn)證的推理過程,然后再給出答案。
張啟超表示,這一思考模式顯著提升了大模型解決復(fù)雜問題的能力,但同時(shí)也帶來了“過度思考”的問題,即在處理簡(jiǎn)單任務(wù)時(shí)也會(huì)生成冗余的思考過程。
“比如使用者對(duì)大模型提問‘2+3等于幾’,大模型可能會(huì)從自然數(shù)定義講起,列出加法交換律,甚至反復(fù)確認(rèn),最后才輸出答案是5。”張啟超說,這種不必要的“過度思考”現(xiàn)象在推理模型中廣泛存在。
針對(duì)這一問題,AutoThink可賦予推理模型根據(jù)題目難度自主切換思考模式的能力,即通過所設(shè)計(jì)的提示詞和多階段強(qiáng)化學(xué)習(xí),引導(dǎo)其自主決定是否進(jìn)行深度思考。
張啟超介紹,AutoThink提供了一種簡(jiǎn)單而有效的推理新范式——通過省略號(hào)提示配合三階段強(qiáng)化學(xué)習(xí),引導(dǎo)大模型不再“逢題必深思熟慮”,而是根據(jù)問題難度自主決定“是否思考”“思考多少”。在多個(gè)數(shù)學(xué)數(shù)據(jù)集上,AutoThink實(shí)現(xiàn)了準(zhǔn)確率與效率平衡,既提升性能又節(jié)省算力,展示出較強(qiáng)的適應(yīng)性和實(shí)用性。
據(jù)悉,AutoThink已集成于一站式智能科研平臺(tái)ScienceOne,并將用于訓(xùn)練ScienceOne的基座大模型S1-Base。研發(fā)團(tuán)隊(duì)表示,讓大模型“更聰明地思考、更簡(jiǎn)潔地表達(dá)”,是未來科學(xué)基礎(chǔ)大模型演進(jìn)的重要方向。
隨著人工智能大模型的不斷發(fā)展,如何讓其在“難”的問題上深入思考,而不是對(duì)所有問題“想個(gè)不停”?記者5月29日從中國(guó)科學(xué)院自動(dòng)化研究所獲悉,該所聯(lián)合鵬城實(shí)驗(yàn)室提出了一種高效推理策略AutoThink,可讓大模型實(shí)現(xiàn)自主切換思考模式,避免“過度思考”。
“當(dāng)前,越來越多的大模型開始具備‘深度思考能力’。”中國(guó)科學(xué)院自動(dòng)化研究所研究員張啟超說,模型在回答問題之前要先生成一整段包含反復(fù)自我反思、自我驗(yàn)證的推理過程,然后再給出答案。
張啟超表示,這一思考模式顯著提升了大模型解決復(fù)雜問題的能力,但同時(shí)也帶來了“過度思考”的問題,即在處理簡(jiǎn)單任務(wù)時(shí)也會(huì)生成冗余的思考過程。
“比如使用者對(duì)大模型提問‘2+3等于幾’,大模型可能會(huì)從自然數(shù)定義講起,列出加法交換律,甚至反復(fù)確認(rèn),最后才輸出答案是5。”張啟超說,這種不必要的“過度思考”現(xiàn)象在推理模型中廣泛存在。
針對(duì)這一問題,AutoThink可賦予推理模型根據(jù)題目難度自主切換思考模式的能力,即通過所設(shè)計(jì)的提示詞和多階段強(qiáng)化學(xué)習(xí),引導(dǎo)其自主決定是否進(jìn)行深度思考。
張啟超介紹,AutoThink提供了一種簡(jiǎn)單而有效的推理新范式——通過省略號(hào)提示配合三階段強(qiáng)化學(xué)習(xí),引導(dǎo)大模型不再“逢題必深思熟慮”,而是根據(jù)問題難度自主決定“是否思考”“思考多少”。在多個(gè)數(shù)學(xué)數(shù)據(jù)集上,AutoThink實(shí)現(xiàn)了準(zhǔn)確率與效率平衡,既提升性能又節(jié)省算力,展示出較強(qiáng)的適應(yīng)性和實(shí)用性。
據(jù)悉,AutoThink已集成于一站式智能科研平臺(tái)ScienceOne,并將用于訓(xùn)練ScienceOne的基座大模型S1-Base。研發(fā)團(tuán)隊(duì)表示,讓大模型“更聰明地思考、更簡(jiǎn)潔地表達(dá)”,是未來科學(xué)基礎(chǔ)大模型演進(jìn)的重要方向。
本文鏈接:http://www.svtrjb.com/v-146-957.html我國(guó)科學(xué)家提出高效推理策略 可避免大模型“過度思考”
相關(guān)文章:
婚禮上長(zhǎng)輩祝詞11-27
總結(jié)過去展望未來句子09-20
幼兒園健康教育工作計(jì)劃10-15
公司銷售人員工作總結(jié)10-05
研學(xué)旅行策劃書01-12
敬老院活動(dòng)感想語活動(dòng)總結(jié)11-22
奮斗青春不遺憾演講稿11-02
讀?三國(guó)演義?有感09-18
材料作文議論文02-19
快樂的六一三年級(jí)作文300字01-03
電影《紅纓槍》觀后感09-28
寫給未來自己的一封信09-07
南充電影工業(yè)職業(yè)學(xué)院學(xué)費(fèi)貴嗎 大概招生多少人04-05
uk是哪個(gè)大學(xué)09-06
《世說新語》閱讀試題答案12-10