文|雪豹財經社 閆學功
AI時代最開放的大模型——12月1日,阿里云CTO周靖人在發(fā)布會上對通義千問提出了這樣的期望。一個月前的云棲大會上,他也同樣將阿里云定義為“AI時代最開放的一朵云”。
這一天,阿里云開源了通義千問720億參數(shù)模型Qwen-72B,這也是目前國內大模型開源的最大參數(shù)。至此,通義千問共開源了18億、70億、140億、720億參數(shù)的4款大模型,以及視覺理解、音頻理解兩款多模態(tài)大模型——阿里云稱之為“全尺寸、全模態(tài)”開源。
今年4月發(fā)布的通義千問,從8月起正式走向開源之路。據(jù)阿里云披露,截至10月末,旗下開源社區(qū)“魔搭”已有超過2300個模型,開發(fā)者超過280萬,模型下載次數(shù)破億。
開源是阿里云大模型最重要的戰(zhàn)略,但這在業(yè)內并不常見。
不論國外的ChatGPT,還是國內的文心一言,都是閉源形式。在半個月前,全球知名的人工智能科學家沈向洋在一個行業(yè)論壇上談及大模型開源閉源路徑之爭。他認為,業(yè)內第一名一定是閉源,第二名他仍然躊躇不定,第三名才會是開源。
當時,周靖人就坐在臺下。
在12月1日的發(fā)布會上,周靖人正面回答了阿里云一定要做開源的原因?!鞍⒗镌频某踔圆皇前涯P瓦谧约菏稚先ド虡I(yè)化,而是幫助開發(fā)者,開源的策略與阿里云的初心完全一致?!痹谒磥恚诋斚峦黄坪蛣?chuàng)新大模型核心技術,開源是“最佳也是唯一的途徑”。
巨頭們爭相布局的大模型,想象空間到底有多大?
10月下旬,聯(lián)想展示了AI PC(人工智能個人電腦)功能,聯(lián)想集團董事長兼CEO楊元慶暢想未來“每個人都能有個人大模型”。周靖人則描繪了更具體的圖景:“大家可以想象今后每一個電子設備、生活的環(huán)節(jié),從你早上醒來第一聲鬧鐘開始,背后都有大模型的支持。”
他甚至表示,不遠的將來,阿里云再舉辦溝通會,他希望全程用通義千問來回答問題。
大模型未來能為行業(yè)和社會帶來什么?目前國內有200多個大模型,未來生態(tài)將更繁榮還是迅速洗牌?通義千問與ChatGPT目前差距多大 ?令人振奮的超級人工智能(AGI)時代何時能夠到來?
就上述問題,12月1日,阿里云CTO周靖人在通義千問發(fā)布會后做了一場閉門分享,雪豹財經社也受邀參與,以下是對話實錄(內容經摘編):
Q:阿里云在三季報發(fā)布后宣布,堅持更長期的投入及優(yōu)先公共云的戰(zhàn)略調整,大模型是否會有相應的策略調整?
A:我們從年初發(fā)布至今整個策略都沒有變化,即一方面做技術的突破,另一方面做生態(tài),提供模型的能力。阿里CEO吳泳銘提出的戰(zhàn)略調整,也跟整個大模型社區(qū)的發(fā)展方向非常吻合,沒什么具體的差異。公司最近會把技術工作路線更加明確下來。
Q:很多大型廠商選擇了不開源,阿里云為什么要選擇開源模式?
A:我認為是大家站位不同。在過去10年內,整個開源社區(qū)蓬勃發(fā)展,今天我們要讓更多技術和更多人參與進來。開源社區(qū)是最佳的、也是唯一的途徑。只有真正從心底去擁抱開放的生態(tài),去促進開發(fā)者社區(qū)的發(fā)展,才能將我們的技術融入到各行各業(yè),最終幫助整個核心技術的突破和創(chuàng)新。
阿里云的初衷不是把模型攥在自己手里,或者做商業(yè)化,而是幫助開發(fā)者。我們的開源策略,跟整個阿里云的初心是完全一致的。因此,我們不光在模型方面開源,數(shù)據(jù)庫、技術等也都貢獻到開源社區(qū)。今天AI的發(fā)展,一定不是由一家公司完成的。不管誰有最強的模型,如果沒有開放的技術和經驗,是無法在各項應用場景中落地的。
Q:在大模型能力上中國企業(yè)和美國企業(yè)的差距是什么?
A:科技創(chuàng)新上,原則上是大家你追我趕,都在做非常中長期的一系列探索,在這個時間點或許有差距,但也許差距在縮小,甚至扭轉也有可能。這就是科技創(chuàng)新的魅力。
我們能看到(和ChatGPT)之間有一定差距,還有需要提升的空間,但是不能妄自菲薄。比如多模態(tài)等,國內很多產品也能做到ChatGPT的水平,甚至超越它。通義千問和ChatGPT 4.0在使用體感上,是互有勝負的。
Q:通義千問與其他閉源模型相比水平如何?
A:講到評測指標,國外的Hugging Face在全球比較有影響力,它有一系列測評標準,會展現(xiàn)一個客觀的評價。當然,不是所有閉源模型都會參與測評。在Hugging Face上,我們在開源14B的時候是非全模型排名第三,72B發(fā)布之后我們會繼續(xù)等待測評。我認為我們可能會登頂。
編者注:Hugging Face是全球最大的開源模型公司,它發(fā)布的各項關于AI公司的榜單在業(yè)界有一定影響力?!稌r代周刊》今年首次發(fā)布的全球百大AI人物中,有兩位來自Hugging Face。
Q:Open AI 最近選擇了Agent作為下一步開發(fā)方向,你們有什么思考和跟進?
A:Agent這個概念不是Open AI最近提出的,但它是一個非常重要的模型利用的領域。目前我們社區(qū)已經貢獻了很多關于Agent的開發(fā)和創(chuàng)新,接下來每個月都有相關進展,包括如何幫開發(fā)者搭建這樣一個Agent,也會有一些新的功能推出。
編者注:Agent可以理解為“智能業(yè)務助理”,它具有人類的思維,在大模型技術驅動下,以自然語言為交互方式,高自動化地執(zhí)行和處理專業(yè)或繁復的工作任務。
Q:聯(lián)想未來將會發(fā)布與阿里云合作完成的AI PC(個人電腦),大模型會給PC帶來哪些實質性影響?
A:與聯(lián)想的合作是一個良好的開端。我們希望不單單是在復雜和昂貴的機器上使用模型的能力,而是把它帶到各種端。當我們真正進入AI時代,大模型將改變日常生活,模型服務在各個領域無所不在。今后每一個電子設備和生活環(huán)節(jié),從早晨的鬧鐘開始,都會有模型的支持。我相信很快會進入這樣一個時代。
Q:未來是否會和更多硬件廠商進行合作?
A:目前已經有不少硬件廠商在洽談,我們的心態(tài)是非常開放的。之所以開源,就是為了不局限于某一個或某幾家廠商,而是有更多開發(fā)者和硬件廠商一起來參與、推動。
Q:怎么看待大模型在C端和B端商業(yè)變現(xiàn)的機會和價值?
A:我們要做是生態(tài)的方方面面,所以當前更加關注的是模型本身。在to C和to B方面應用的探索會有一些,但還沒有到井噴的狀態(tài)。模型的應用是沒有to C和to B之分的,但我們也希望模型的能力能夠滲透到日常生活和工作學習中。接下來會看到一些創(chuàng)新,也許今后幾個月,我們就會聊到一系列應用,以及如何幫助到to C和to B的產品。
Q:阿里云認為實現(xiàn)AGI還要多久?
A:AGI已經成為社會性的話題,有各種各樣的解釋。但我認為現(xiàn)在談AGI還太早,因為還有很多技術難題,還有很多長足的工作要做。由于ChatGPT的爆發(fā),讓一年前不怎么關注人工智能的人現(xiàn)在都在關注,我作為技術工作者感到欣慰。但從整個技術發(fā)展來看還需要很多時間,請大家給予更多耐心。不要今天關注一個熱點,3個月沒爆發(fā),大家就淡忘了。
編者注:AGI可以理解為超級人工智能,Open AI將其作為最終目標并寫在公司白皮書中。它如此定義AGI:“一個高度自治的系統(tǒng),能在多數(shù)有經濟價值的工作上超越人類?!?/em>
Q:通義千問會將技術產品優(yōu)化和商業(yè)化落地當成重點,還是像Open AI一樣將AGI當作愿景?
A:我們做的工作其實是沒有人指引的。通義千問首先是追求技術的卓越和極致的技術探索。如何能夠把模型的方方面面提升起來?這本身就是一個研究課題,這方面一定是我們接下來的工作重點。
但在這個時代,科研、技術、產品這幾個維度是更有機地聯(lián)合在一起的,沒辦法像以前分得那么開。光埋頭苦干做研究,不做技術產品、不做技術生態(tài),在今天也不行。這就是為什么通義千問是一整個通義模型家族。我們不斷追求技術突破,同時也開源自己的模型,幫助整個生態(tài)繁榮。我們還做產品,包括通義千問App、網(wǎng)頁版產品。
Q:通義千問在技術上還面臨哪些挑戰(zhàn)?
A:整個大模型還處在發(fā)展初期。不管誰家的大模型,都還有很多提升空間。今天的模型具備視覺、聽覺的能力,但如何像人一樣思考、去識別萬物,所有大模型都還有一定差距。通義千問產品這次推出了視覺模型能力,對圖片的理解在很多層面是超過ChatGPT 4.0的,但距離人類的認知能力還有一定差距。
如何讓這個模型有更多思維能力、像人一樣去思考,這方面才剛剛起步。我們當前有非常多要解決的技術難點,這也是為什么接下來每個月都會有一系列技術突破。整個通義千問模型的升級能力遠遠沒有結束。
Q:實現(xiàn)了從0到1后,是創(chuàng)新更重要,還是推廣產品更重要?
A:追求技術的卓越一直是阿里云的初衷。在一定程度上,所謂從0到1和從1到2沒有本質區(qū)別,都是在做突破。從0到1非常難,因為要探索一條新的道路。但繼續(xù)把產品技術打磨好,每提高一個百分點,其實也隱藏著非常多的技術難題和投入。
Q:上一次開源14B反響不錯,為什么要再去開源更高的72B?哪些場景是14B無法解決的?
A:14B是一個非常好的起點,但模型的能力還在不斷發(fā)展中,創(chuàng)新技術的突破一直沒有停止過,14B更往上還有很多提升的空間。這是推出72B模型的初衷,今后14B和7B也會有升級的版本出來。
在不同的企業(yè)和不同的開發(fā)環(huán)境,大家對模型的尺寸、能力及背后使用的資源有不一樣的考慮,有時會追求極致的性能。我們不應該用一個模型、一個尺寸,要求大家對接所有的場景,而是應該把選擇權留給開發(fā)者和企業(yè)。
Q:國內已經發(fā)布了200多個大模型,需要這么多嗎?合理的生態(tài)是什么樣的結構?
A:任何一項技術都有一個蓬勃發(fā)展并快速迭代的周期,最終也可能受技術、商業(yè)等各方面的約束而收斂。生態(tài)的好處,就是它自己會收斂到合適的局面。
今天我們有200多款大模型,能夠感受到科技界積極擁抱的態(tài)度。今年1月時大家還感覺很消極,覺得跟海外差距很大,到12月已經沒有這樣的感覺。我相信整個市場、整個生態(tài)也會進行優(yōu)勝劣汰的選擇,也會收斂到更完整、完善的狀態(tài),這就是生態(tài)的魅力。
轉載請注明來自浙江中液機械設備有限公司 ,本文標題:《阿里云CTO周靖人:開源是唯一出路,通義千問和ChatGPT互有勝負》
還沒有評論,來說兩句吧...