近期,中國工業(yè)互聯(lián)網(wǎng)研究院(簡稱“工聯(lián)院”)針對人工智能大模型在中文工業(yè)領(lǐng)域的知識問答能力進行系統(tǒng)性評測。結(jié)果顯示,百度文心一言表現(xiàn)超過GPT3.5,綜合評價指數(shù)在國內(nèi)排名第一。
(資料圖片)
工聯(lián)院本次評測選取了工業(yè)領(lǐng)域典型的八大行業(yè)。百度文心一言在電子設(shè)備、裝備、鋼鐵、采礦、電力、石化、建材等七大行業(yè)均獲國內(nèi)第一。
據(jù)悉,評測對象涵蓋GPT4、GPT3.5、文心一言、ChatGLM等國內(nèi)外具有代表性的頭部大模型。評估結(jié)果選取性能前六名的模型進行公布。
百度文心一言測評表現(xiàn)超過GPT3.5
本次工業(yè)知識問答測試主要分為客觀題與主觀題兩大類,總計超過1100個問題。主觀題主要考察四大維度:基礎(chǔ)能力、語句能力、概括能力和邏輯能力。
評測結(jié)果顯示,GPT4表現(xiàn)最佳。國內(nèi)頭部大模型表現(xiàn)亮眼,整體與GPT3.5相當。其中百度文心一言表現(xiàn)超過GPT3.5,在國內(nèi)大模型中排名第一。
在客觀題環(huán)節(jié),評測結(jié)果顯示,GPT4與文心一言表現(xiàn)好于其他大模型。但評測結(jié)果也同時指出,大模型普遍準確率有較大的提升空間。
主觀題方面,國內(nèi)大模型的基礎(chǔ)能力、語句能力與GPT4接近,概括能力、邏輯能力與GPT4有一定差距。
在大模型的自我認知能力和污染問題分析能力上,GPT4相較于其他大模型表現(xiàn)出更好的能力。
大模型發(fā)展新熱點:豐富特定行業(yè)專業(yè)知識
雖然國內(nèi)大模型在本次評測表現(xiàn)較好,甚至在部分行業(yè)趕超GPT3.5,但工聯(lián)院評測報告也指出,國內(nèi)外通用大模型在工業(yè)知識問答領(lǐng)域探索仍處于初級階段,國內(nèi)大模型與GPT4有差距,比如行業(yè)間的泛化能力有待加強。
實際上,工聯(lián)院評測報告揭示出通用大模型落地垂直行業(yè)的痛點,缺乏特定行業(yè)的專業(yè)知識。
關(guān)于解決難題的方法,工聯(lián)院評測報告給出的建議是,進一步豐富相關(guān)專業(yè)領(lǐng)域的數(shù)據(jù)訓練集,進一步進行專業(yè)化的微調(diào)。
當前,國內(nèi)科技公司紛紛加強與工業(yè)企業(yè)合作,期望通過在實際場景中探索應(yīng)用大模型,彌補差距,趕超GPT4.0。
比如百度文心一言與南方電網(wǎng)電力調(diào)度控制中心在電力調(diào)度場景探索使用調(diào)度AI大模型。在汽車行業(yè),長安汽車基于百度文心大模型正在開發(fā)生成式人工智能產(chǎn)品,賦能一款量產(chǎn)車型,實現(xiàn)提升用戶體驗的目標。除了能源、汽車制造,百度智能云還在建筑、采礦、物流、紡織等領(lǐng)域,探索使用大模型提升運營效率和用戶體驗效果。
據(jù)悉,未來,工聯(lián)院將持續(xù)開展通用大模型在工業(yè)領(lǐng)域更多維度的性能評測,包括但不限于大模型的魯棒性、安全性以及人類大價值觀等。(肖智)
關(guān)鍵詞:
推薦內(nèi)容
- 天天快播:工聯(lián)院大模型測評:文心一言在工業(yè)領(lǐng)域表現(xiàn)超過GPT3.5 a>
- 當前速讀:聶黎明:新產(chǎn)業(yè)發(fā)展有三大趨勢 助力現(xiàn)代化產(chǎn)業(yè)體系建設(shè) a>
- 推進職業(yè)教育產(chǎn)教融合 專家:使產(chǎn)業(yè)需求融入人才培養(yǎng)全過程 a>
- 港交所、北交所:支持符合條件的企業(yè)在兩地上市 熱推薦 a>
- 世界報道:?3連板東方通信:公司市盈率顯著高于行業(yè)市盈率水平 a>
- 觀焦點:易事特:擬與員工持股平臺設(shè)鈉離子電池公司 a>
- 新股暗盤 | 艾迪康控股(09860)暗盤收漲1.14% 每手賺70港元|今日熱訊 a>
- 全球關(guān)注:崔東樹:1-5月汽車行業(yè)利潤1746億元 同比增長24% a>
- 中鋼協(xié):建議國家宏觀調(diào)控部門將冶金煤納入國家調(diào)控機制_環(huán)球通訊 a>
- 煤炭工業(yè)協(xié)會、煤炭運銷協(xié)會發(fā)布《關(guān)于做好迎峰度夏期間煤炭保供穩(wěn)價工作的倡議書》|新資訊 a>
- 商業(yè)飛行潛力引關(guān)注 Joby Aviation(JOBY.US)盤前漲超14%創(chuàng)52周新高 a>
- 比亞迪:將向加勒比地區(qū)提供新能源乘用車產(chǎn)品 a>
- 莆田鞋在哪里買 - 推薦6個購買渠道 a>
- 每日熱點:苯乙烯材料指的是什么東西?苯乙烯的用途應(yīng)用范圍主要有哪些? a>
- 全球最新:基金認購好還是申購好?為什么不建議購買新基金? a>
- 婚內(nèi)出軌有哪些精神賠償標準? 請求精神損害賠償有哪些條件? a>
- 海南自貿(mào)港180個項目集中開工建設(shè)_全球看點 a>
- 當前熱文:珠江啤酒控股股東擬減持不超2.259%股份 a>
- 怎樣保護眼睛近視? 高度近視保護眼睛的方法有哪些?|全球速遞 a>
- 百事通!怎樣保護眼睛近視? 高度近視保護眼睛的方法有哪些? a>
-
1微動態(tài)丨描寫山澗小溪的好句子(精選174句)
-
2熱點評!鏖戰(zhàn)“春節(jié)檔”!消費貸利率一降再降,釋放了何種信號
-
3視焦點訊!杭蕭鋼構(gòu)1月17日快速上漲
-
4處女座和什么星座最配
-
5怎樣順利、及時地運送出去,讓老百姓吃到保質(zhì)保量、新鮮放心的菜品?
-
6天天速看:呵護流動性合理充裕 央行超額續(xù)做“麻辣粉”
-
7山西:支持各類企業(yè)在疫情防控期間有序復工復產(chǎn)
-
8多國推出多項應(yīng)對危機舉措
-
923江西債03票面利率為2.9600%
-
10環(huán)球頭條:翱捷科技:1月17日融券賣出金額34.76萬元,占當日流出金額的0.26%