大模型“畫龍”,小數(shù)據(jù)“點睛”
企業(yè)加快智能化轉(zhuǎn)型
◎本報記者 翟冬冬
小數(shù)據(jù)、優(yōu)質(zhì)數(shù)據(jù)應(yīng)用有其前提,即需要在大的基礎(chǔ)模型(預(yù)訓(xùn)練模型)之上,通過小數(shù)據(jù)進行模型的微調(diào),使模型更加精準(zhǔn)地服務(wù)具體應(yīng)用場景。從這個角度來講,小數(shù)據(jù)將在未來基礎(chǔ)模型完成下游任務(wù)時,起到關(guān)鍵的作用。
王金橋
中國科學(xué)院自動化研究所研究員
如今大數(shù)據(jù)已經(jīng)成為人工智能的“標(biāo)配”。在訓(xùn)練人工智能模型的過程中,如果想讓其變得更加聰明,大量的、多樣性的數(shù)據(jù)必不可少。但近日,著名人工智能學(xué)者吳恩達在展望人工智能下一個10年的發(fā)展方向時,表達了不同的觀點。他認為,小數(shù)據(jù)、優(yōu)質(zhì)數(shù)據(jù)的應(yīng)用或是未來趨勢。
中國科學(xué)院自動化研究所研究員王金橋表示,小數(shù)據(jù)、優(yōu)質(zhì)數(shù)據(jù)應(yīng)用有其前提,即需要在大的基礎(chǔ)模型(預(yù)訓(xùn)練模型)之上,通過小數(shù)據(jù)進行模型的微調(diào),使模型更加精準(zhǔn)地服務(wù)具體應(yīng)用場景。從這個角度來講,小數(shù)據(jù)將在未來基礎(chǔ)模型完成下游任務(wù)時,起到關(guān)鍵的作用。
多數(shù)應(yīng)用場景難以獲取高質(zhì)量大數(shù)據(jù)
算法(模型)、算力和數(shù)據(jù)可以說已經(jīng)成為推動人工智能發(fā)展的三大要素,其中數(shù)據(jù)尤為重要。在眾多互聯(lián)消費場景中,我們常常被精準(zhǔn)的人工智能推送“擊中”。通過對消費者消費習(xí)慣、購物偏好的分析,平臺系統(tǒng)可以對消費者的潛在需求作出判斷并加以引導(dǎo),而這一切的基礎(chǔ),是基于大量的、豐富的數(shù)據(jù)樣本。利用大數(shù)據(jù),平臺構(gòu)建出了適用于該領(lǐng)域的專用模型,實現(xiàn)精準(zhǔn)推送。
這些體驗或許是普通消費者對于大數(shù)據(jù)和人工智能最直接的印象之一。吳恩達在采訪中也表示,在過去10年里,面向消費者的企業(yè)由于擁有大量用戶群(有時甚至高達數(shù)十億),因此獲得了非常大的數(shù)據(jù)集使得人工智能可以開展深度學(xué)習(xí),并給企業(yè)帶來了不少經(jīng)濟效益。但他同時強調(diào),這種法則并不適用于其他行業(yè)。其原因在于,并不是所有場景都能產(chǎn)生豐富的大數(shù)據(jù)樣本。
實際上,“在生活中,百分之八九十場景的問題都屬于小樣本問題?!蓖踅饦虮硎荆芏鄳?yīng)用場景中,由于訓(xùn)練樣本難以獲取,因此只有極少量數(shù)據(jù),缺陷檢測就是其中的典型案例。缺陷檢測,即采用機器視覺技術(shù)等,對某種特定缺陷進行檢測和識別。這種檢測在航天航空、鐵路交通、智能汽車等眾多領(lǐng)域都有應(yīng)用。由于在實際的生產(chǎn)生活中,存在瑕疵的產(chǎn)品總是少數(shù),所以缺陷檢測的訓(xùn)練樣本數(shù)量很少。
而即使對于樣本豐富的場景,也存在訓(xùn)練數(shù)據(jù)標(biāo)注愈發(fā)困難的問題。王金橋介紹,目前人工智能所使用的訓(xùn)練數(shù)據(jù),還是以人工標(biāo)注為主,而在海量數(shù)據(jù)面前,人工標(biāo)注往往需要行業(yè)經(jīng)驗,一般人難以對標(biāo)注區(qū)域進行識別。此外,針對每個應(yīng)用需求都需要人工智能專家設(shè)計算法模型,模型越多,開發(fā)成本也會持續(xù)增加。
吳恩達也表示,在消費互聯(lián)網(wǎng)行業(yè)中,我們只需訓(xùn)練少數(shù)機器學(xué)習(xí)模型就能服務(wù)10億用戶。然而在制造業(yè)中,有1萬家制造商就要搭建1萬個定制模型。而且要做到這點往往需要大量的人工智能專家。
從目前的行業(yè)發(fā)展趨勢來看,基礎(chǔ)模型或許是解決上述問題的一個方向。
以基礎(chǔ)模型為“基座”用小數(shù)據(jù)微調(diào)
“近些年,行業(yè)開始重視研發(fā)基礎(chǔ)模型或者說是通用型模型來解決上述問題。”王金橋說,先用大量數(shù)據(jù)預(yù)訓(xùn)練一個模型。這些模型在預(yù)訓(xùn)練中,見多識廣是首要任務(wù)。訓(xùn)練中,模型會見識到該領(lǐng)域各式各樣的數(shù)據(jù),增長見識,以應(yīng)對今后出現(xiàn)的各種情況。之后再在下游任務(wù)中利用具體的場景數(shù)據(jù)進行微調(diào)。
如自然語言處理(NLP)領(lǐng)域的大模型,如果要利用它完成如對話、問答等下游任務(wù),只需要使用這個下游任務(wù)中數(shù)量很小的數(shù)據(jù),在這個大模型之上進行微調(diào),就能達到不錯的效果。一些研究成果也表明,只需要原來建立專屬模型5%—10%的數(shù)據(jù)樣本用于大模型的數(shù)據(jù)微調(diào),就能得到和專屬模型一樣的精度。
“從大模型轉(zhuǎn)向小模型,實現(xiàn)一個模型做多個任務(wù),可以說是目前行業(yè)發(fā)展中的一個轉(zhuǎn)變?!蓖踅饦蛘f,這樣不僅降低了開發(fā)難度,還大大減少了開發(fā)成本。以前,每個算法都需要一個深度學(xué)習(xí)專家去設(shè)計和訓(xùn)練,現(xiàn)在只需要在大模型之下進行微調(diào),模型的設(shè)計和架構(gòu)也變得相對簡單。中小型企業(yè)只需要在大模型上,自己上傳數(shù)據(jù)就可以完成。
此外,利用這種方法,模型的誤報率也會減少?;A(chǔ)模型見過豐富多彩的數(shù)據(jù)和場景,在處理具體任務(wù)的時候就具備了海量知識儲備,有更充足的準(zhǔn)備去應(yīng)對具體的小場景應(yīng)用。
不過吳恩達在訪談中也表示,預(yù)訓(xùn)練只是要解決難題的一小部分,更大的難題是提供一個工具讓使用者能夠選擇正確的數(shù)據(jù)用于微調(diào),并用一致的方式對數(shù)據(jù)進行標(biāo)記。面對大數(shù)據(jù)集的應(yīng)用時,開發(fā)者的通常反應(yīng)都是如果數(shù)據(jù)有噪音也沒關(guān)系,所有數(shù)據(jù)照單全收,算法會對其進行平均。但是,如果研究人員能夠開發(fā)出用來標(biāo)記出數(shù)據(jù)不一致地方的工具,為使用者提供一種非常有針對性的方法來提高數(shù)據(jù)質(zhì)量,那這將是獲得高性能系統(tǒng)的更有效的方法。
多模態(tài)或是大模型未來發(fā)展方向
基礎(chǔ)模型作為生產(chǎn)眾多小模型的“基座”,性能尤為重要。其認知能力越接近人類,在此之上產(chǎn)生的小模型性能也將越優(yōu)異。
在探索外部環(huán)境的時候,人類具備視覺、聽覺、觸覺等多種認知手段,并通過語言對話等形式實現(xiàn)互動交流。其中視覺得到的信息約占70%,聽覺、觸覺等獲得的信息約占30%?!巴瑯樱沟么竽P偷男阅芨觾?yōu)秀,更趨近人類的認知能力,就涉及到訓(xùn)練中的數(shù)據(jù)融合問題?!蓖踅饦蛑赋?,我們熟知的語言生成模型GPT-3,能夠生成流暢自然的文本,并完成問答、翻譯、創(chuàng)作小說等一系列NLP任務(wù),甚至可以進行簡單的算術(shù)運算。但其和外界交互的主要方式還是進行文本交流,缺乏圖像、視頻等多模態(tài)融合。
每一種信息的來源或者形式,都可以稱為一種模態(tài)。如人有觸覺、聽覺、視覺、嗅覺;信息的媒介有語音、視頻、文字等。人的認知模型可以說是一個多模態(tài)的集合。
要讓基礎(chǔ)模型的預(yù)訓(xùn)練更接近人類的認知模型,也需要進行多模態(tài)融合。即讓模型通過機器學(xué)習(xí)的方法實現(xiàn)處理和理解多源模態(tài)信息的能力,如圖像、視頻、音頻、語義之間的多模態(tài)學(xué)習(xí)。多模態(tài)預(yù)訓(xùn)練模型被廣泛認為是從限定領(lǐng)域的弱人工智能邁向通用人工智能路徑的探索。
“這一兩年,大模型的數(shù)量呈現(xiàn)爆發(fā)式增長,且有從單一模態(tài)模型轉(zhuǎn)向多模態(tài)模型的趨勢?!蓖踅饦蛘f,具備了多模態(tài)能力的基礎(chǔ)模型,在具體應(yīng)用場景中健壯性更好,在異常和危險情況下系統(tǒng)的生存能力更強,今后多模態(tài)基礎(chǔ)模型或?qū)⒊蔀槲磥砘A(chǔ)模型發(fā)展的一個重要方向。
關(guān)鍵詞: 人工智能
推薦內(nèi)容
- “大賣場”模式不吃香,高鑫零售(06808)欲靠賣會員尋出路? a>
- 天工國際(00826)連續(xù)兩日回購共100萬股 合計耗資232.23萬港元-世界觀焦點 a>
- 世界滾動:電報解讀|南方傳媒(601900.SH):超低估值 AI+教育有場景有用戶有收入空間大 a>
- “蛋荒”不再?美國雞蛋批發(fā)價或?qū)⒌?美元/打-環(huán)球熱門 a>
- 全球快播:電報解讀|金融是AIGC優(yōu)質(zhì)變現(xiàn)場景 AI+金融前景廣闊 a>
- 強制性轉(zhuǎn)股指的是什么?強制性轉(zhuǎn)股的種類有哪些? a>
- 降準(zhǔn)會對股市造成哪些影響?降準(zhǔn)對老百姓意味著什么? a>
- 股權(quán)投資指的是什么意思?股權(quán)投資具有哪些特點? a>
- 股權(quán)籌資的優(yōu)點有哪些?股權(quán)籌資的缺點有哪些? a>
- 股票為什么復(fù)盤目的是什么?股票復(fù)盤的具體步驟流程 a>
- 優(yōu)先股屬于什么會計科目?優(yōu)先股和普通股有什么區(qū)別? a>
- 注冊制股票的含義是什么?注冊制股票漲跌幅限制規(guī)則 a>
- 申請留學(xué)貸款需要什么材料?留學(xué)貸款額度最高是多少? a>
- 什么樣的基金算是好基金?好基金的標(biāo)準(zhǔn)要求是什么? a>
- 理財保險是怎么賠償損失的?理財保險不想交了可以退嗎? a>
- “萬歷文物主題特展”明起開放,世界僅此一頂?shù)摹敖鹨砩乒凇绷料?/ a>
- 染發(fā)=整容?2023最火“發(fā)色模板”,顯白洋氣不挑人! a>
- 開放式基金指的是什么?開放式基金贖回有限制嗎? a>
- ipo上市指的是什么意思?企業(yè)上市前財務(wù)要做什么? a>
- 公司發(fā)行債券指的是什么?公司發(fā)行債券需要什么條件? a>
-
1微動態(tài)丨描寫山澗小溪的好句子(精選174句)
-
2熱點評!鏖戰(zhàn)“春節(jié)檔”!消費貸利率一降再降,釋放了何種信號
-
3視焦點訊!杭蕭鋼構(gòu)1月17日快速上漲
-
4處女座和什么星座最配
-
5怎樣順利、及時地運送出去,讓老百姓吃到保質(zhì)保量、新鮮放心的菜品?
-
6天天速看:呵護流動性合理充裕 央行超額續(xù)做“麻辣粉”
-
7山西:支持各類企業(yè)在疫情防控期間有序復(fù)工復(fù)產(chǎn)
-
8多國推出多項應(yīng)對危機舉措
-
923江西債03票面利率為2.9600%
-
10環(huán)球頭條:翱捷科技:1月17日融券賣出金額34.76萬元,占當(dāng)日流出金額的0.26%