數(shù)智上海 2023 峰會 | 通用、垂直、AI Agent,大模型是如何擁抱千行百業(yè)應用場景的?
由于通用大模型的泛化特性,它很難在落地行業(yè)場景中精準滿足用戶需求。讓通用大模型學習行業(yè)知識和行業(yè)語料成為行業(yè)大模型,再進一步學習業(yè)務知識和專業(yè)領(lǐng)域工具演進為場景大模型,是當前大模型落地應用的關(guān)鍵路徑。未來,AI Agent 的產(chǎn)品形式被越來越多地認為是大模型的進化方向,是賦能各行各業(yè)的高效生產(chǎn)力工具。
通用大模型性能如何保障?如何架構(gòu)行業(yè)垂直大模型?AI Agent 落地前景?數(shù)智上海 2023 峰會上,最具代表性的產(chǎn)學一線嘉賓圍繞大模型演進過程,帶來了前沿分享。
以「智能創(chuàng)新賦能產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型」為主題,數(shù)智上海 2023 峰會已圓滿落幕。其中,聚焦引領(lǐng)新一輪科技浪潮的關(guān)鍵 AI 技術(shù),峰會特別舉辦了「數(shù)智說」生成式人工智能創(chuàng)新應用賦能千行百業(yè)論壇。
復旦大學計算機科學技術(shù)學院教授、博士生導師,中國中文信息學會理事張奇,商湯科技副總裁張少霆,科大訊飛 AI 研究院副院長盛志超,創(chuàng)新奇智技術(shù)副總裁郭江亮等進行了主題演講。圓桌環(huán)節(jié),達觀數(shù)據(jù)首席戰(zhàn)略官劉江賢主持,張奇、中科曙光智能計算產(chǎn)品部總經(jīng)理杜夏威、實在智能創(chuàng)始人、CEO 孫林君,瀾碼科技創(chuàng)始人、CEO 周健、上海人工智能產(chǎn)業(yè)基金投研合伙人劉經(jīng)國交流了觀點。
嘉賓們分享了生成式 AI 最新技術(shù)進展,以及其在醫(yī)療、教育、工業(yè)等重要領(lǐng)域落地的關(guān)鍵經(jīng)驗,探討了 AI Agent 的落地前景。
復旦 NLP 實驗室核心成員張奇
摒棄神化與擬人化大模型
ChatGPT 能夠高效生成更符合人類價值觀的內(nèi)容,背后的關(guān)鍵技術(shù)正是基于人類反饋的強化學習(RLHF)。然而受限于實驗設計困難、試錯成本巨大等多重因素,RLHF 的穩(wěn)定訓練仍然是一個難題。
復旦 NLP 團隊今年發(fā)布多項 RLHF 相關(guān)工作成果。復旦大學計算機科學技術(shù)學院教授、博士生導師,中國中文信息學會理事張奇結(jié)合最新研究成果帶來「AI 賦能百業(yè),大模型助力行業(yè)數(shù)智化升級」主題分享。
此次,張奇教授總結(jié)了 RLHF 大模型訓練各階段關(guān)鍵問題。預訓練階段,基礎(chǔ)大語言模型訓練中的「工程秘密」大部分已經(jīng)公開,但仍需做好「預訓練數(shù)據(jù)構(gòu)成和數(shù)量、預訓練數(shù)據(jù)對模型各類任務效果影響、語言與知識的關(guān)系」等基礎(chǔ)問題研究,否則大模型訓練仍是「煉丹」。指令微調(diào)階段,千億模型的 SFT 模型訓練數(shù)據(jù)需求不到百萬量級,難點在于構(gòu)建高質(zhì)量訓練語料。
OpenAI 此前公布的 InstructGPT 技術(shù)報告中將近端策略優(yōu)化(PPO)算法作為 RLHF 階段的強化學習算法,但未開源訓練技術(shù)細節(jié)。FudanNLP 團隊持續(xù)投入 RLHF 完整工作流程及 PPO 算法研究,確定了使得 PPO 算法在大模型人類對齊方面行之有效的關(guān)鍵因素,并進一步總結(jié)出在大模型上訓練更穩(wěn)定的 PPO-max 算法。張奇教授展示了 PPO-max 算法效果并表示近期會發(fā)布安全倫理相關(guān)報告。
「摒棄神化與擬人化大模型,它們只是統(tǒng)計學習的精彩舞者?!箯埰娼淌谡J為目前大模型表現(xiàn)還是可以在統(tǒng)計機器學習范疇下進行解釋,仍是「匹配」而非「理解」。此外,現(xiàn)階段通用大語言模型直接落地產(chǎn)業(yè)存在一定困難,未來落地方向需要結(jié)合場景,「do something people want」,不只是寫詩、做論文,還應助力行業(yè)提升生產(chǎn)力。
商湯科技副總裁張少霆
打造「商湯醫(yī)療大模型工廠」
隨著大模型開始進入產(chǎn)業(yè)導入期,大模型的垂直領(lǐng)域應用成為主線。從醫(yī)學科研、藥物研發(fā)、智慧診療到醫(yī)院管理等,產(chǎn)學研正聯(lián)手推動高質(zhì)量醫(yī)療領(lǐng)域基礎(chǔ)模型構(gòu)建及產(chǎn)品落地。AI 成為每個醫(yī)生的診療助手、每個人的健康助手的醫(yī)療場景新范式正在顯現(xiàn)。
商湯科技副總裁張少霆帶來了「基于 AI 大模型打造未來醫(yī)療場景新范式」主題演講。
人的疾病有幾萬種,存在大量長尾問題,大模型、基礎(chǔ)模型的能力會有助于快速開發(fā)醫(yī)療長尾問題解決方案?;诖?,商湯在醫(yī)療領(lǐng)域進行了豐富的大模型落地應用探索。
商湯與行業(yè)伙伴合作,推出了醫(yī)療大語言模型、醫(yī)療影像大模型、生信大模型等多模態(tài)基礎(chǔ)模型群,覆蓋CT、MRI、超聲、內(nèi)鏡、病理、醫(yī)學文本、生信數(shù)據(jù)等廣泛醫(yī)療數(shù)據(jù)模態(tài)。借助商湯大裝置的超大算力和醫(yī)療基礎(chǔ)模型群的堅實基礎(chǔ),商湯能夠化身「醫(yī)療大模型工廠」,幫助醫(yī)療機構(gòu)針對下游臨床任務高效訓練模型。該模式突破了醫(yī)療長尾問題數(shù)據(jù)樣本少、標注難度高的瓶頸,實現(xiàn)了針對不同任務的小樣本、弱標注、高效率的訓練,滿足不同醫(yī)療機構(gòu)個性化、多樣化的臨床診療需求。
在醫(yī)療多模態(tài)基礎(chǔ)模型群賦能下,商湯自主研發(fā)的SenseCare?智慧診療平臺搭載 20 余個 AI 輔助診療模塊,可提供覆蓋全身多部位、多病種、多模態(tài)數(shù)據(jù)的 AI 輔助分析,賦能診-療-愈全流程。其中,SenseCare?肝臟智能手術(shù)規(guī)劃系統(tǒng)可以快速完成肝內(nèi)及腹部多器官的精準三維重建,并支持多種切除術(shù)式智能規(guī)劃,將原先 1~2 小時的手術(shù)規(guī)劃時間縮短至 3~5 分鐘,大幅提升了術(shù)前規(guī)劃效率。該產(chǎn)品已落地瑞金、新華等醫(yī)院,為很多高難度手術(shù)提供了保障。
針對醫(yī)療大語言模型的應用場景探索,商湯研發(fā)了醫(yī)療健康大語言模型「大醫(yī)」,內(nèi)嵌智能自診、診后隨訪管理、智慧病歷、影像報告結(jié)構(gòu)化等 13 個預設場景,可高效輔助醫(yī)生診療與患者服務。「大醫(yī)」支持提示工程自定義、長程記憶存取和醫(yī)學知識庫查詢總結(jié)等個性化功能,可幫助醫(yī)療健康產(chǎn)業(yè)鏈上下游機構(gòu)打造專屬醫(yī)療健康大模型,推動行業(yè)全方位數(shù)智化轉(zhuǎn)型。目前「大醫(yī)」已落地鄭州大學第一附屬醫(yī)院、瑞金醫(yī)院、新華醫(yī)院等醫(yī)院,賦能用藥咨詢、患者服務、輔助決策等多元場景。
科大訊飛 AI 研究院副院長盛志超
共迎「認知大模型+教育」大時代
認知大模型的「智能涌現(xiàn)」將帶來解決人類剛需的全新機遇。改變信息分發(fā)獲取模式、革新內(nèi)容生產(chǎn)模式、全自然交互完成任務、實現(xiàn)專家級的虛擬助手、顛覆傳統(tǒng)手工編程方式、成為科研工作的加速器,這些大模型能力催生的變革正帶來多種教育場景的顛覆式創(chuàng)新。
科大訊飛 AI 研究院副院長盛志超分享了星火認知大模型賦能教育的實踐探索。
ChatGPT 發(fā)布后,科大訊飛正式啟動「1+N」認知大模型專項攻關(guān),其中「1」是通用認知智能大模型,「N」是大模型在教育、辦公、汽車、人機交互等各個領(lǐng)域落地,目前一系列產(chǎn)品已經(jīng)實際應用。
基于星火認知大模型能力開發(fā)的多種應用,已經(jīng)支撐了不同場景教學工作:
? 教學助手,星火教師助手應用能夠輔助教案設計、習題情境改造、作文批改等;
? 學習助手,「訊飛語伴」面向各學段學生提供個性化口語陪伴老師,另外基于科普中國優(yōu)質(zhì)內(nèi)容資源構(gòu)建科普大模型;
? 編程助手,面向信息科技教學場景,輔助教師高效編程教學,輔導學生自主編程與學習(Python);
? 心理輔導助手,構(gòu)建心理健康專有模型,具備多模態(tài)情感識別能力、共情表達能力、尋因式提問能力、個性化心理指導能力四大核心能力。
從實現(xiàn)效能提升、加速模式創(chuàng)新到支撐育人變革,大模型帶來了教育領(lǐng)域機遇,同時在專業(yè)性、教學秩序、協(xié)同素養(yǎng)提升等方面帶來挑戰(zhàn)。盛志超院長認為,應該以樂觀的態(tài)度看待大模型與教育結(jié)合帶來多種場景的顛覆式創(chuàng)新。
創(chuàng)新奇智技術(shù)副總裁郭江亮
為工業(yè)大模型落地提供全鏈路 AI 能力
大模型的出現(xiàn)給智能制造帶來廣闊想象空間,但是工業(yè)領(lǐng)域涉及全生產(chǎn)流程、供應鏈各個環(huán)節(jié)以及 ERP、MES、PLC 等,提供端到端解決方案并非易事。
創(chuàng)新奇智技術(shù)副總裁郭江亮進行了「大模型助力新型工業(yè)化:重構(gòu)工業(yè)生產(chǎn)力與生產(chǎn)關(guān)系」主題演講,分享了企業(yè)在工業(yè)大模型落地方面的前沿工作。
全面擁抱大模型技術(shù)是企業(yè)提升競爭力必由之路,而對于工業(yè)領(lǐng)域的企業(yè)來說,垂直大模型不需要唯參數(shù)論,大模型落地性價比是關(guān)鍵因素。通過更好地使用大模型技術(shù),以更低成本、更好產(chǎn)品,滿足工業(yè)領(lǐng)域里面中長尾、細小場景需求是當務之急。
創(chuàng)新奇智推出的以 AInno-15B 為核心的「奇智孔明 AInnoGC 工業(yè)大模型」,建立在開源通用大模型基礎(chǔ)上,專注工業(yè)知識的生成、問答以及工業(yè)自動化任務的編排。從效果看,150 億模型參數(shù)是最優(yōu)效果,同時部署時對算力要求較低。
創(chuàng)新奇智構(gòu)建起由「MMOC 人工智能技術(shù)平臺」和「AInnoGC 工業(yè)大模型技術(shù)平臺」組成的技術(shù)雙塔布局。其中,MMOC 平臺提供傳統(tǒng) AI 能力,端到端支持 AI 解決方案創(chuàng)新、研發(fā)和交付,工業(yè)大模型支持文本、視覺、多模態(tài)內(nèi)容生成,驅(qū)動 AI 2.0 應用和解決方案的開發(fā)與落地。
郭江亮表示,創(chuàng)新奇智將AI技術(shù)雙塔平臺化,組合研發(fā)打造解決方案,未來還將持續(xù)聚焦工業(yè)細分領(lǐng)域,助力打造更多專精特新企業(yè)。
產(chǎn)學投共論大模型下一站
AI Agent 會是大模型未來發(fā)展方向嗎?
受大語言模型浪潮推動,AI Agent 相關(guān)研究快速發(fā)展。兩者的區(qū)別在于,大模型與人類之間的交互是基于 prompt 實現(xiàn)的,用戶 prompt 是否清晰明確會影響大模型回答的效果;而僅需給定 AI Agent 一個目標,它就能夠針對目標獨立思考并做出行動。因此,AI Agent 的產(chǎn)品形式被認為將廣泛應用于各行業(yè)組織數(shù)字化實體打造進程。
AI Agent 會是大模型的未來發(fā)展方向嗎?以此為題,學術(shù)、產(chǎn)業(yè)、投資界多位嘉賓進行了深入交流。
達觀數(shù)據(jù)首席戰(zhàn)略官劉江賢主持了本次對話,指出 Agent 不是一個科研的具象,而是一個落地應用場景的具象,大模型發(fā)展不僅要從供給側(cè)發(fā)力,更要聽需求側(cè)真實聲音,「Agent 像是產(chǎn)、學、研之間交匯的基點」。
「我們堅定地看好 Agent,并且認為 Agent 會大爆發(fā)。2024 年會是 Agent 元年。」實在智能創(chuàng)始人、CEO 孫林君認為,首先,當前處在從人工過渡到人機協(xié)同、再到機器完全自主完成的過程中,要對 Agent 有合理的預期,不能把 Agent 和 AGI 畫等號,認為它無所不能,這是不符合實際的預期;其次,有針對性的進行人機協(xié)同的產(chǎn)品設計才是現(xiàn)實思路,設計出來的產(chǎn)品才是高可用的,Agent 的實用性才會更強。
「Agent 未來落地,真正有話語權(quán)是那些業(yè)務場景的用戶?!怪锌剖锕庵悄苡嬎惝a(chǎn)品部總經(jīng)理杜夏威認為,要從業(yè)務側(cè)出發(fā)看 Agent 的落地形式和方向,圍繞著業(yè)務需要的 Agent,判斷對模型規(guī)模、算力形式的需求。
當前大多數(shù) RPA 廠商,都在以生成式 AI 補充 RPA 為中心的自動化流程,或者基于 AI Agent 重新構(gòu)建超自動化產(chǎn)品。張奇教授認為這將是大模型 B 端落地的關(guān)鍵方式,傳統(tǒng) RPA 構(gòu)建業(yè)務流程自動化存在脆弱性,大語言模型的引入這意味著這些機器人不會停在新數(shù)據(jù)導致的「死胡同」,而是可以從錯誤中「學習」并調(diào)整其一系列任務。
信息化是數(shù)字化的前提,數(shù)字化是數(shù)智化的前提。瀾碼科技創(chuàng)始人、CEO 周健認為,AI Agent 落地過程首先要將專家知識通過各類信息系統(tǒng)實現(xiàn)數(shù)字化;其次是基于對話式UI,建立機器適應人的新的人機交互模式;第三步則是通過這種新的交互模式,反復使用和打磨專家知識,最終實現(xiàn)領(lǐng)域知識的循環(huán)沉淀。
Agent 產(chǎn)品將會越來越多,未來將有望成為 AI 應用層的基本架構(gòu),包括 to C、to B 產(chǎn)品等。上海人工智能產(chǎn)業(yè)基金投研合伙人劉經(jīng)國認為,從投資角度看,國內(nèi) to B、垂類應用仍是 AI Agent 容易率先落地的方向。
轉(zhuǎn)載請注明來自浙江中液機械設備有限公司 ,本文標題:《數(shù)智上海 2023 峰會 | 通用、垂直、AI Agent,大模型是如何擁抱千行百業(yè)應用場景的?》
還沒有評論,來說兩句吧...