隨著人工智能大模型的不斷發展,如何讓其在“難”的問題上深入思考,而不是對所有問題“想個不停”?記者5月29日從中國科學院自動化研究所獲悉,該所聯合鵬城實驗室提出了一種高效推理策略AutoThink,可讓大模型實現自主切換思考模式,避免“過度思考”。
“當前,越來越多的大模型開始具備‘深度思考能力’。”中國科學院自動化研究所研究員張啟超說,模型在回答問題之前要先生成一整段包含反復自我反思、自我驗證的推理過程,然后再給出答案。
張啟超表示,這一思考模式顯著提升了大模型解決復雜問題的能力,但同時也帶來了“過度思考”的問題,即在處理簡單任務時也會生成冗余的思考過程。
“比如使用者對大模型提問‘2+3等于幾’,大模型可能會從自然數定義講起,列出加法交換律,甚至反復確認,最后才輸出答案是5。”張啟超說,這種不必要的“過度思考”現象在推理模型中廣泛存在。
針對這一問題,AutoThink可賦予推理模型根據題目難度自主切換思考模式的能力,即通過所設計的提示詞和多階段強化學習,引導其自主決定是否進行深度思考。
張啟超介紹,AutoThink提供了一種簡單而有效的推理新范式——通過省略號提示配合三階段強化學習,引導大模型不再“逢題必深思熟慮”,而是根據問題難度自主決定“是否思考”“思考多少”。在多個數學數據集上,AutoThink實現了準確率與效率平衡,既提升性能又節省算力,展示出較強的適應性和實用性。
據悉,AutoThink已集成于一站式智能科研平臺ScienceOne,并將用于訓練ScienceOne的基座大模型S1-Base。研發團隊表示,讓大模型“更聰明地思考、更簡潔地表達”,是未來科學基礎大模型演進的重要方向。
隨著人工智能大模型的不斷發展,如何讓其在“難”的問題上深入思考,而不是對所有問題“想個不停”?記者5月29日從中國科學院自動化研究所獲悉,該所聯合鵬城實驗室提出了一種高效推理策略AutoThink,可讓大模型實現自主切換思考模式,避免“過度思考”。
“當前,越來越多的大模型開始具備‘深度思考能力’。”中國科學院自動化研究所研究員張啟超說,模型在回答問題之前要先生成一整段包含反復自我反思、自我驗證的推理過程,然后再給出答案。
張啟超表示,這一思考模式顯著提升了大模型解決復雜問題的能力,但同時也帶來了“過度思考”的問題,即在處理簡單任務時也會生成冗余的思考過程。
“比如使用者對大模型提問‘2+3等于幾’,大模型可能會從自然數定義講起,列出加法交換律,甚至反復確認,最后才輸出答案是5。”張啟超說,這種不必要的“過度思考”現象在推理模型中廣泛存在。
針對這一問題,AutoThink可賦予推理模型根據題目難度自主切換思考模式的能力,即通過所設計的提示詞和多階段強化學習,引導其自主決定是否進行深度思考。
張啟超介紹,AutoThink提供了一種簡單而有效的推理新范式——通過省略號提示配合三階段強化學習,引導大模型不再“逢題必深思熟慮”,而是根據問題難度自主決定“是否思考”“思考多少”。在多個數學數據集上,AutoThink實現了準確率與效率平衡,既提升性能又節省算力,展示出較強的適應性和實用性。
據悉,AutoThink已集成于一站式智能科研平臺ScienceOne,并將用于訓練ScienceOne的基座大模型S1-Base。研發團隊表示,讓大模型“更聰明地思考、更簡潔地表達”,是未來科學基礎大模型演進的重要方向。
本文鏈接:http://www.svtrjb.com/v-146-957.html我國科學家提出高效推理策略 可避免大模型“過度思考”
相關文章:
七月底寫給自己的霸氣語錄07-07
高情商贊美老公的話語11-27
侄女婚禮上的祝詞11-09
母親節的唯美文案10-26
2024年學生管理工作總結 學生管理工作總結與反思(6篇)10-05
幼兒園班級游戲活動總結范文5篇精選08-22
大學生協會招新策劃書08-31
秋季《開學第一課》中學生觀看心得體會12-17
初一軍訓心得感想11-22
蘇霍姆林斯基《給教師的一百條建議》讀后感1000字10-26
初一軍訓心得體會內容09-19
一個敬佩的人小學作文03-26
新年祝福語詞語01-09
美麗的大梅沙高二作文12-23
優美的排比句09-28
山東菏澤2024年度高級經濟師專業技術資格證書發放時間:8月28日開始09-02
大班科學活動教案:好朋友04-15
幼兒園中班主題我的家真漂亮教案12-17
《語文園地八》教學設計11-22
幼兒園24節氣之白露的教案09-07
大學生暑假工社會實踐報告07-08
物流實習日記01-21
簡單溫暖文案10-12