都可賦予大模型慢思考能力 360首創(chuàng)CoE架構(gòu)媲美OpenAI o1思維鏈模式

分享到:

都可賦予大模型慢思考能力 360首創(chuàng)CoE架構(gòu)媲美OpenAI o1思維鏈模式

2024年09月16日 17:36 來源:中國新聞網(wǎng)
大字體
小字體
分享到:

  9月13日,OpenAI發(fā)布具有推理能力的人工智能模型“o1”,備受行業(yè)矚目。o1通過模仿人類的思維過程,強(qiáng)化學(xué)習(xí)和“思維鏈”技術(shù),引導(dǎo)模型自主解決問題。這一特點(diǎn)在解決復(fù)雜問題,尤其是在科學(xué)、編碼和數(shù)學(xué)等領(lǐng)域,展現(xiàn)出了超越以往模型的強(qiáng)大能力。

  據(jù)了解,o1和GPT系列模型最大的區(qū)別主要在于,該系列模型是在思考之后回答用戶問題,輸出高質(zhì)量的內(nèi)容,而非迅速回應(yīng)無效答案,即用模仿人類思維過程的“慢思考”代替過去追求快速響應(yīng)的“快思考”,這與國內(nèi)一家大模型企業(yè)在近兩個(gè)月前提出的觀點(diǎn)不謀而合——早在今年7月底舉辦的ISC 2024大會(huì)上,360集團(tuán)創(chuàng)始人周鴻祎就宣布,360將“用基于智能體的框架打造慢思考系統(tǒng),從而增強(qiáng)大模型的慢思考能力”,并在近期多次強(qiáng)調(diào),將“利用智能體框架,讓大模型從快思考轉(zhuǎn)成慢思考模式,把多個(gè)大模型組合起來解決業(yè)務(wù)問題”。

  對(duì)于o1的推出,周鴻祎在其最新發(fā)布的短視頻中表示,過去建立在大參數(shù)、大數(shù)據(jù)量的模型技術(shù)演進(jìn)終于找到了新的突破方向,也為下一個(gè)階段人工智能的進(jìn)步和應(yīng)用開辟了巨大的空間?!皁1不是像大模型一樣用文字來訓(xùn)練,而是像自己和自己下棋一樣,通過強(qiáng)化學(xué)習(xí)來實(shí)現(xiàn)這種思維鏈的能力”,周鴻祎說。

  周鴻祎用“快思考”和“慢思考”兩項(xiàng)人類具備的能力對(duì)思維鏈強(qiáng)大的原因進(jìn)行了解讀。他指出,快思考的特點(diǎn)是快速直覺、無意識(shí),反應(yīng)很快但能力不夠強(qiáng)。GPT類大模型通過訓(xùn)練大量知識(shí),主要學(xué)習(xí)的是快思考能力,這也是為什么GPT類大模型脫口而出的答案質(zhì)量不夠穩(wěn)定,“就像人一樣,不假思索出口成章而不出錯(cuò)非常難實(shí)現(xiàn)”;慢思考的特點(diǎn)則是緩慢、有意識(shí)、有邏輯性,需要分很多步驟,類似寫一篇復(fù)雜的文章,要先列提綱,根據(jù)提綱去搜集數(shù)據(jù),收集素材,根據(jù)素材進(jìn)行討論,再把文章寫出來,還要進(jìn)行潤色和修改?!斑@一次o1擁有了人類慢思考的特質(zhì),在回答問題前會(huì)反復(fù)地思考,拆解、理解、推理,可能會(huì)自己問自己1000遍,然后才能給出最終的答案?!?/p>

  不過,盡管在“慢思考”能力上取得了巨大突破,o1依然難稱完美。據(jù)媒體報(bào)道,目前的o1-preview版本依舊存在幻覺問題、運(yùn)行速度較慢及成本高昂等諸多局限性,限制了其應(yīng)用范圍。與之相比,更早提出“慢思考”概念的360通過其首創(chuàng)的CoE(Collaboration of Experts,專家協(xié)同)技術(shù)架構(gòu)及混合大模型對(duì)“慢思考”進(jìn)行落地實(shí)踐,該技術(shù)架構(gòu)已落地在360 AI搜索、360 AI瀏覽器等多款產(chǎn)品中。AI助手通過CoE架構(gòu)還接入了很多小參數(shù)專家模型,在回答簡單問題時(shí)調(diào)用更精準(zhǔn)的“小模型”,在獲得高質(zhì)量回答的同時(shí)還能節(jié)約推理資源、提升響應(yīng)速度,實(shí)現(xiàn)對(duì)“慢思考”過程中速度過慢等問題的改進(jìn)。

  據(jù)了解,近期有國內(nèi)技術(shù)團(tuán)隊(duì)通過將思維鏈優(yōu)化為CoE協(xié)同工作模式,使用任意三個(gè)模型協(xié)同工作達(dá)到了和OpenAI o1-preview類似的反思決策效果。經(jīng)過21道復(fù)雜邏輯推理題測(cè)試結(jié)果顯示,其效果與OpenAI o1-preview相當(dāng),完全超越GPT-4o,有時(shí)還能超越o1-preview。

  “所以,以后比的不是多快能給你答案,而是給的答案完不完整,這也會(huì)改變?nèi)斯ぶ悄芊?wù)的業(yè)態(tài),人工智能到最后還是要參考人類大腦的組成來構(gòu)造工作模式”,周鴻祎說。

【編輯:邵婉云】
發(fā)表評(píng)論 文明上網(wǎng)理性發(fā)言,請(qǐng)遵守新聞評(píng)論服務(wù)協(xié)議
本網(wǎng)站所刊載信息,不代表中新社和中新網(wǎng)觀點(diǎn)。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。
Copyright ©1999-2024 chinanews.com. All Rights Reserved

評(píng)論

頂部