大模型通向AGI,騰訊云攜手業(yè)界專家探索創(chuàng)新應用新風向

引言

一年過去,ChatGPT引發(fā)的AGI熱潮絲毫未減。只是相對于最初推出時掀起的全民大模型熱,如今關于該如何落地的討論更多了起來。

隨著算力、數據庫、大數據等底層技術的發(fā)展,大模型的建設與在各個領域的應用正在加速推進,那么,這些跡象是否預示著AGI正在到來?最先進的大模型技術又有哪些共同表現(xiàn)?回到國內,大模型當前的應用場景面臨哪些挑戰(zhàn),應該如何解決?有哪些趨勢和機遇值得創(chuàng)業(yè)者關注?

為解答以上問題,近日,騰訊云TVP AI創(chuàng)變研討會系列第二期「AI下半場,探創(chuàng)新與應用風向」在深圳騰訊濱海大廈舉行,邀請多位 AI 領域資深專家進行前沿分享,并特別設置了全場嘉賓的深度分組腦暴,現(xiàn)場思維火花碰撞,精彩觀點迸發(fā)。

“我做了十幾年人工智能,在過去的一年里深刻感受到這一技術的日新月異。去年GPT出來之后,我把相關的論文看了一遍,追到6月份整理了很多材料,覺得理解差不多了。結果下半年又不斷出來新的創(chuàng)新點,包括各種應用,我就不禁想問,大模型的極限究竟在哪里?”在主持人,火光搖曳CEO、騰訊云TVP靳志輝的開場設問下,本次活動正式開啟。

以大模型為代表的AGI:自主決策、自我探索、自我迭代

“ChatGPT出來之后,人們發(fā)現(xiàn)它通過了圖靈測試。所以,我在今年春節(jié)期間寫過一篇文章,旗幟鮮明地提出AGI即將來臨。”

在《通用人工智能的現(xiàn)在與未來》主題演講中,達觀數據副總裁、騰訊云TVP 王文廣首先追溯了從神經網絡概念的最初提出,到如今這一技術在大模型上的延續(xù)。具體來說,目前大模型的發(fā)展主要呈現(xiàn)以下特點:

·模型的多樣化。從2017年谷歌發(fā)布Transformer到2018年,兩年間產業(yè)界開始不斷涌現(xiàn)出具有代表力的模型。其中,典型如BERT和GPT,GPT比BERT的出現(xiàn)更早,但是在語言處理能力上,首先爆發(fā)的是BERT。當時,在閱讀理解能力評測上,BERT首次超越了人類專家的水平。

·參數規(guī)模和數據規(guī)模的爆發(fā)。BERT在“閱讀理解”上的優(yōu)異表現(xiàn)拉開了模型參數“野蠻增長”的時代,直至今日GPT-4達到1萬億的參數規(guī)模。同時,數據語料也從BERT時期的幾百兆,達到現(xiàn)在的幾PB甚至是幾十PB。

從大模型發(fā)展的整體格局來看,全球大模型聚集地還是在硅谷,然后是中國的“百模大戰(zhàn)”,歐洲在這一“戰(zhàn)場”上明顯落后,出彩者寥寥。

關于大模型如何在實際中更好地應用,王文廣特別強調:大模型有依靠自身無法解決的“幻覺”問題,導致了準確性和事實性無法保證。所以對它的使用需要有所限定,在對可靠性和真實性要求不高的情況下非常有用。針對大模型也不擅長做數學計算,王文廣說:“我的建議是,可以通過代碼解釋器運行大模型給出的結果,這是一種可行的方法。”

據其介紹,目前大模型的應用主要集中在文字創(chuàng)作相關領域,包括查閱資料、營銷文案、創(chuàng)作小說,主要基于搜索和編造的強大能力。

“但如果需要保證可靠性,特別像我們達觀數據大模型平臺‘曹植’面向產業(yè)應用,就需要想方設法地利用檢索增強,通過知識圖譜的方法對它的結果做校驗,做知識的憑據、二次的驗證,去做所有答案的溯源。”

構想未來,王文廣認為,以大模型為代表的AGI將進一步發(fā)展至“自主決策、自主探索和自我迭代”的新時代。而相對于自我迭代難度較高,自主決策和自我探索正在實現(xiàn):

“‘輸出’無非兩種:一種語言,一種工具。語言發(fā)展到最新就是現(xiàn)在的大語言模型,此外用視頻訓練大模型的方向也值得關注。而在使用工具上,也不乏應用工具的 Agents和工具調用方法。也可以將大模型作為大腦與機器人相結合,機器人根據指令操作,實現(xiàn)“具身智能。”

而在更遙遠的未來,我們或者不得不面對“硅機一日、碳基千年”的處境。當世界上出現(xiàn)第一個真正意義上的機器人,盡管是人造物,但它的智能水平遠比人高。人類社會是構建在“人類是唯一的智能體”這個隱性條件下的,“那么,人類當下的社會架構是否還能存在?是否可以保持現(xiàn)狀?這些問題將留給社科、哲學等領域的學者們來研究。”王文廣最后表示道。

資本耐心有限下,AI成功落地的關鍵要素

“無論是事業(yè)、技術,還是人生,都是S型曲線,不可能一帆風順地增長,也不可能一直跌在谷底,總是會遵循S曲線的發(fā)展路徑。AI的發(fā)展也是如此。”資深人工智能技術專家、創(chuàng)東方投資總監(jiān)、騰訊云TVP 邵浩在《AI創(chuàng)業(yè)賽道趨勢與投融資》的主題演講中如是表示。

從1956年人工智能概念的提出,到2012年AlexNet取得ImageNet的冠軍,看似AI再一次迎來了新的產業(yè)利好。2013年至2019年間,NLP、AR、VR等技術發(fā)展勢頭良好,很多概念公司拿到融資。但實際上,產業(yè)仍處于炒作周期,直到2019年,迎來本輪浪潮的第一次低谷。

“我們知道技術轉化是需要長期沉淀的,但是資本卻沒有多少耐心。在美國,資本的耐心可能可以達到十年,但在中國,或許最多有七年,股東就需要看到投資回報。”

按照資本運作的邏輯,當項目在短期內難以達到預期回報,就很難避免被關停的命運?;谏酆圃贏I投資領域的切身體驗,他認為當下大模型投資標的選擇非常困難。

那么,在資本耐心有限的情況下,AI技術若想成功落地又有哪些關鍵要素?

首先,是做到高效應用。在邵浩看來,無論是將大語言模型應用到辦公軟件,還是將AI的搜索能力應用于信息的抓取和推薦,都是AI在普及化場景中的優(yōu)秀應用案例。在專業(yè)領域也需要找到痛點方向,比如通過大數據幫助醫(yī)學領域進行重大發(fā)現(xiàn),尋找新的靶點等。

“是否是好的應用,大概有幾個判斷要素:包括行業(yè)屬于勞動密集型,企業(yè)生產工具類、普適性產品,終端場景包括軍工、醫(yī)藥、銀行、券商等等。包含了這些關鍵點就更容易走得通。”

其次,需要形成完整的產業(yè)閉環(huán)。比如,在半導體領域,需要從原材料、設備、人才、配套、生產、銷售,各個環(huán)節(jié)一起形成市場化的產業(yè)鏈。在AI領域也是一樣,如果難以形成市場閉環(huán),就很難交付出用戶真正喜歡的產品。

在此基礎上,邵浩分享了在AI投資中重點考量的因素:“以我們公司‘深圳創(chuàng)東方投資’為例,主要講求七個字‘廣深高速進出行’,包括面向市場的廣闊性、產品創(chuàng)新的深厚性、團隊配置高、成長速度快,以及進入和退出價格的合理性和投資的可行性。”

除此之外,邵浩也從自身資深的創(chuàng)業(yè)經歷出發(fā),給到他對AI創(chuàng)業(yè)者兩點建議:

其一,AI決定技術上限,但不要盲目追求。基于AI的復雜性和高成本附加,可以的話在項目前期進行技術替代,如果進展順利,在后續(xù)過程中再引入AI,這樣可以降低投資人的風險預期;其二,除技術之外,新產品該如何取代舊產品的市場也值得創(chuàng)業(yè)者多思考。

最后,基于對大模型未來技術發(fā)展的預判,邵浩提出幾點具體建議:

·關注AI發(fā)展中的瓶頸要素和領域應用,如算力、行業(yè)數據;

·具體領域應用中,醫(yī)療與軍工領域較有機會;

·以用戶需求和產業(yè)需求為導向,選擇“+AI”的項目,而非“AI+”的項目;

·保持前瞻性眼光,如關注多模態(tài)等前沿方向;

·強調“產業(yè)閉環(huán)”。

向量數據庫:實現(xiàn)多模態(tài)數據打通和人與數據的互動

“大語言模型的本質是把治理范式進行了轉移,它的作用主要體現(xiàn)在即使是非程序員,也可以方便地通過自然語言來調度隱藏在大語言模型背后的GPU算力。”

在《向量數據庫:AI時代的數據樞紐》主題演講中,騰訊云數據庫副總經理 羅云首先提出了他對大模型的看法。

進一步,與強大算力相配套的,則是完善的數據存儲平臺。通過在騰訊云的內部實踐,在構建存儲平臺上羅云認為需要攻克以下兩個關鍵點:

·數據的多模態(tài)。包括關系型數據庫數據、文件系統(tǒng)中的數據,以及存儲的非結構化數據,這些數據都是價值數據,需要通過智能化的方式加以利用。其中,關鍵在于數據的多模態(tài)互動,做到表數據、KV數據、圖片數據等不同模態(tài)下的數據對應和流通。

·以自然語言為基礎的人與數據的交互。如何無需通過程序員就能調度底層存儲,包括讀寫數據、檢索數據等任務。

要達成以上兩點,需要運用向量數據庫的“中樞”和“索引”作用:

·向量數據庫是數據中樞。數據之間存在信息差的關鍵點在于格式不一致,而通過“向量”的方式,可以讓多模態(tài)數據最終表達為一種格式。

·向量數據庫位于索引層。通過向量數據庫,可以索引包括數據庫、大數據、文件系統(tǒng)等各個不同數據空間中的數據,是通用索引層,方便查找。

此外,當預判到向量數據庫可能面臨實現(xiàn)企業(yè)級和智能化的挑戰(zhàn),騰訊云也做了不少業(yè)內里程碑式的嘗試,包括:

·與中國信通院標準制定組織一起完成了千億規(guī)模的測試。“包括實現(xiàn)最高支持千億級向量規(guī)模和500萬QPS峰值能力,達到99.99%的可用性;我們也是國內首家通過信通院標準測試的向量數據庫;同時,和信通院一起聯(lián)合50多家企業(yè)共同發(fā)布了國內首個向量數據庫標準《向量數據庫技術要求》。”

·端到端的召回率提升30%以上。通過集成Embedding,實現(xiàn)自然語言查詢;通過AI套件的應用,實現(xiàn)端到端的RAG應用檢索,從而使召回率提升30%以上。

“通常大家會用框架去做,但我們測下來發(fā)現(xiàn)準確率表現(xiàn)不是很高,基本上通過開源方案去搭建,端到端的召回率能做到50%就算高的。為提升召回率,我們在內部也做了很多嘗試,比如和PCG業(yè)務團隊的合作,將他們的一些知識平臺化,做成標準的解決方案運用到行業(yè)之中,這樣就能讓行業(yè)發(fā)展得更快。這樣一套做下來,召回率可以達到70~80%。”

事實上,騰訊云向量數據庫自今年中以來數據表現(xiàn)持續(xù)亮眼、增長飛速,但羅馬不是一天建成的。據羅云介紹,早在2015年,騰訊集團內部就將騰訊云向量數據庫進行了多方布局。比如應用在騰訊視頻、騰訊新聞中,以保證用戶上傳內容,也就是UGC的內容可靠性。“我們的方法是把新聞、視頻截幀之后轉換成向量保存下來,再通過查重和非允許的一些敏感數據去做向量匹配,這樣就可以快速審核內容素材。”

截至目前,騰訊云向量數據庫在集團內部有超過40個業(yè)務的接入,每天完成1600億次請求。此外,自今年7月份向量數據庫上云,在3個月左右的時間里已經累計了1500家以上企業(yè)級用戶和開發(fā)者用戶,增長飛速。

分組腦暴,觀點碰撞

三位嘉賓的精彩演講結束后,主持人火光搖曳CEO、騰訊云TVP 靳志輝總結道:“‘通向AGI之路’我非常認可,AGI的話題也非常吸引人。如果對這個話題感興趣,推薦大家讀3本書:《生命3.0》《未來簡史》以及《千腦智能》,基本上很好地解讀了未來人類AGI的發(fā)展走向。”

緊接著,人人參與的深度探討環(huán)節(jié)正式開啟,主持人火光搖曳CEO、騰訊云TVP靳志輝提出四個關于大模型和AI技術的熱點問題,現(xiàn)場嘉賓以小組抽簽的形式分別選擇不同話題進行探討,然后各小組派代表進行發(fā)言,其他小組組員也可以針對性地發(fā)表自己的看法。熱點討論結束后,特別設置了爭議性話題“觀點PK”環(huán)節(jié),嘉賓在交流過程中也碰撞出更多精彩觀點。

熱點討論

話題1:GPTs會給創(chuàng)業(yè)者帶來什么樣的機會,它的未來會如何演化?

來自第一組的發(fā)言代表,53AI創(chuàng)始人、騰訊云TVP 楊芳賢表示:這個話題我在過去幾個月做了非常深入的思考,我們現(xiàn)場小組綜合討論之后的觀點是:GPT-4對行業(yè)發(fā)展很有價值,就像2000年時出現(xiàn)的互聯(lián)網產品“個人主頁系統(tǒng)”,普通用戶都可以通過主頁系統(tǒng)簡單DIY出自己的個人網站。今天,當時最早的個人站長已經成為了今天中國互聯(lián)網人才的主力。

由此來看,GPTs強大的編排能力和極低的使用門檻將極大推動大模型應用的普及以及為大模型行業(yè)培養(yǎng)大量的人才。未來十年,無論是To C還是To B的場景會有大量的AI應用出現(xiàn),這些應用會是獨立開發(fā),并不會是基于GPTs來構建。

話題2:對于AI、大模型的未來發(fā)展,看好哪些核心方向?

第二組發(fā)言代表的北京大學教授、北京大學深圳系統(tǒng)芯片設計重點實驗室主任、騰訊云TVP 何進提出,經過小組討論后,我們普遍認為這個問題不會特別明確,從核心技術方向來看,智能時代的五個大方向包括:CPU構成的調度能力、GPU構成的計算能力、Memory構成的儲存能力、網絡構成的傳輸能力,以及大數據。

其中,計算和存儲能力可以通過存算一體的芯片進行融合,如果加上感知層,還可以實現(xiàn)感、存、算的三層融合,未來可能還能夠進一步融合網絡傳輸能力。而從應用方向來看的話,我們更看好“AI智能體”的未來發(fā)展。

話題3:AI、大模型與行業(yè)或領域可以有哪些結合,看好怎樣的應用場景?

對于這個問題,第三組發(fā)言代表九四智能合伙人 湯丁青表示,以智能外呼業(yè)務為例,在沒有大模型之前,主要是進行一些比較單一的人機和用戶交互,依賴主流程的結構化。當有了大模型之后,可以結合用戶信息,以及在交互過程中多輪的動態(tài)信息去做動態(tài)決策,核心在于提高AI的存單轉化。

此外,各小組的嘉賓也結合自身所在領域的應用場景發(fā)表了各自見解。

vivo研發(fā)總監(jiān)、騰訊云TVP 楊振濤指出,大模型在軟件研發(fā)領域可以讓更多工程師來做更高附加值的“填空題”,把人更擅長的創(chuàng)造部分發(fā)揮出來。流程化或是找Bug的工作則可以交給AI Agent解決。

主持人火光搖曳CEO、騰訊云TVP 靳志輝則結合其所在語言教育領域,指出NLP中的一些重要場景。一是兒童語言學習及成人語言學習,已經有很多創(chuàng)業(yè)公司利用ChatGPT對話技術產出下一代語言訓練場景。此外,在未來的老年社會,如何利用AI給老人提供陪伴及情緒價值,在他看來也是可以應用的場景。

話題4:未來十年的中美AI競爭,中國將逐漸追平還是越拉越遠?

對于這個問題,第四組的發(fā)言代表美團無人機高級技術總監(jiān)、騰訊云TVP 陳天健答道,經過組內討論,我們認為未來雖然有差距,但也不會越來越遠,首先,雖然有算力的差距,但是在現(xiàn)實的AI應用中,并沒有多少場景需要那么強大的算力。比如在自動駕駛領域的兩家中美公司,美國公司的算力比中國公司高一倍,但主要是用在了視覺上,中國公司則是通過更優(yōu)質的傳感器來做替代,由此可見,我國可以在AI產品應用領域尋找優(yōu)勢路徑;其次,在原創(chuàng)技術方面,中美之間仍然需要在研發(fā)投入、人才和時間等維度進行比拼。

而討論到算力方面,主持人火光搖曳CEO、騰訊云TVP靳志輝保持樂觀,他認為當前中國的算力研發(fā)突破很快,AI人才方面也在不斷追趕,未來大模型技術發(fā)展我國有能力緊跟美國不掉隊。

觀點PK:“有效加速”還是“超級對齊”?

有效加速理論代表人物:SamAltman、YannLecun、AndrewNg(吳恩達)

核心觀點:技術發(fā)展不應受到其他因素限制,要更加開放,AI無需監(jiān)管。

超級對齊理論代表人物:ElonMusk、Hinton、IlyaSutskever

核心觀點:基于技術帶來的潛在威脅,應該對AI系統(tǒng)的行為進行引導,讓其能夠符合設計者的意圖,也就是需要監(jiān)管。

從正方觀點來看,之所以贊同“有效加速”,主要在于各國最終都會選擇去監(jiān)管,但因為AGI對人的影響很大,監(jiān)管的結果好壞尚未可知。達觀數據副總裁、騰訊云TVP 王文廣提出:未來AGI將至,并將帶來很大的影響,在這一點上兩派人物的觀點是一致,只是Ilya希望在讓AGI服務人類之后再放開給大家使用,Altman則是希望先發(fā)展,搶先占領機會。對于目前中美在AI發(fā)展上存在差距,我認為應該首先支持發(fā)展,在技術上進行追趕。

反方則從人性的角度出發(fā),認為缺乏有效監(jiān)督、治理下的“有效加速”則會造成“屁股決定腦袋”,甚至“個人利益凌駕與集體利益”的局面。對此,中科氫焱CDO、騰訊云TVP 曾永紅表示說:當今法治社會需要倫理和秩序。未來無論多久,不管是在物理世界還是虛擬世界,最終都反映到物理世界的:人類負責規(guī)則與秩序,硅基負責實現(xiàn)和執(zhí)行。例如數據的獲取和使用是否合規(guī)的問題,如果AI訓練的數據不受約束,將會造成失控的局面,先污染再治理可能造成無法逆轉的傷害,因此預見性的監(jiān)管框架能夠更好地發(fā)展和利用AI。

正方vivo研發(fā)總監(jiān)、騰訊云TVP 楊振濤進一步指出,這涉及非常多關于價值觀的話題,現(xiàn)在不少人會帶“e/acc”的標簽,表明自己是“有效加速主義”支持者。有的人可能認為這代表了一種精英的傲慢,但實際上,在技術成長的階段,AGI突破的前夕,如果有太多監(jiān)管,必然影響到技術本身的發(fā)展。換個角度,從社會和政府層面,可能需要考慮的是大環(huán)境與價值觀的問題,包括法律的完善、科技倫理等等,這些都會考慮到,但是需要在合適的時機,不應該在新技術這棵小苗初長新葉的時候就噴農藥,還是要給它生長的空間。

反方PP停車創(chuàng)始人&CEO、騰訊云TVP 李劍再次聲明自己的觀點:我想表達的觀點是從人類發(fā)展長河的角度去思考這個問題,當所有都不受控的時候,秩序從何而來,人類不僅僅是在當前這個時代,在20、30、100年的長河里面都是一瞬間,如白駒過隙 ,我的觀點是需要監(jiān)管,來保證長期的秩序。

最后,騰訊云數據庫副總經理 羅云對兩方的觀點進行了調和,讓這個辯題的思考上升到了哲學層面:這個論題我自己的看法是沒有答案。相信沒有人會說我們人類的目的是為了制造AI,碳基的目的是制造硅基。我們運用AI最終的目的一定是服務于人類,幫助我們提升生產力,讓人類更加幸福。那么在這一大的目的共識下,我認為當前的階段應該放手向前跑,做大膽的嘗試,這對于我國科技的發(fā)展更加有益。

結語

事實上,AGI首先是一個技術命題,但它同時也是社會命題和哲學命題。所以,在本次TVP AI創(chuàng)新研討會上,無論是嘉賓演講還是線下討論,都會在技術之上加入對AGI的社會性思考和哲學思辨,這也是本次活動的超預期收獲。

秉持“用科技影響世界”的初心,騰訊云TVP還將攜手各界專家,共同探索大模型在不同維度、各個領域中的理論前沿和技術實踐,共同邁向AGI的智能未來。

TVP,即騰訊云最具價值專家(Tencent Cloud Valuable Professional),是騰訊云授予云計算領域技術專家的一個獎項。TVP致力打造與行業(yè)技術專家的交流平臺,促進騰訊云與技術專家和用戶之間的有效溝通,從而構建云計算技術生態(tài),實現(xiàn)“用科技影響世界”的美好愿景。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )