華為、字節(jié)跳動相繼入局大模型,當(dāng)前的AI賽況如何?
中國的通用大模型競賽進(jìn)入第一個賽點(diǎn),此前百度、阿里、騰訊、商湯、360 等國內(nèi)大廠已經(jīng)相繼宣布入局?!栋俣劝⒗?、商湯華為推出AI大模型,新一輪的AI大戰(zhàn)是概念炒作還是產(chǎn)業(yè)風(fēng)口?| 深度詳盤》
目前這項(xiàng)大廠參賽的方式是發(fā)布一個通用大模型、或者數(shù)個行業(yè)大模型底座,從而給行業(yè)中的客戶提供基于這些基礎(chǔ)模型和自身擁有的行業(yè)數(shù)據(jù)精調(diào),打造一個服務(wù)自身業(yè)務(wù)的 AI 應(yīng)用。
如今,華為和字節(jié)也先后參賽,采用的方式略有不同。
華為已經(jīng)披露了盤古大模型的細(xì)節(jié),根據(jù)已有的介紹,該模型分為三層架構(gòu):L0層的5個基礎(chǔ)大模型、L1層的N個行業(yè)通用大模型以及L2層可以讓用戶自主訓(xùn)練的更多細(xì)化場景模型。華為云提供了分層解耦的設(shè)計(jì),企業(yè)用戶可以根據(jù)自己的業(yè)務(wù)需要選擇適合的大模型開發(fā)、升級或精調(diào),從而適配千行百業(yè)多變的需求。
據(jù)華為介紹,最基層對標(biāo)的是通用大模型,這一層稱之為基礎(chǔ)大模型。在這之上還打造了行業(yè)模型和場景模型,很關(guān)鍵的一點(diǎn)就是要把各行各業(yè)的知識與大模型進(jìn)行充分的匹配和融合。華為在最底層構(gòu)建了以鯤鵬和昇騰為基礎(chǔ)的AI算力云平臺,基于華為的AI根技術(shù),大模型訓(xùn)練效能可以調(diào)優(yōu)到業(yè)界主流GPU的1.1倍。
此外,華為云還重點(diǎn)介紹了盤古大模型與具體行業(yè)結(jié)合的典型案例,涉及政務(wù)、氣象、鐵路、制造、金融等多個行業(yè)。通過“5+N+X”的這三層大模型,華為云構(gòu)建了自己的大模型底座,展示了高度成熟、成體系化的業(yè)務(wù)能力。
“AI底層應(yīng)用趨勢在于垂直行業(yè)的融合”,數(shù)字經(jīng)濟(jì)應(yīng)用實(shí)踐專家駱仁童博士舉例,“在國外,我們知道像BloombergGPT其實(shí)就是典型的大模型賦能金融行業(yè),所以從發(fā)展來看,未來所有的行業(yè)領(lǐng)域都要面臨AI大模型的重構(gòu),行業(yè)的智能化都會基于通用大模型延伸?!?/p>
在具體的應(yīng)用中,華為云發(fā)布會上介紹的盤古氣象大模型在氣象領(lǐng)域引起了廣泛關(guān)注。這項(xiàng)技術(shù)可以在極短的時間內(nèi)提供更精確的氣象預(yù)測,比傳統(tǒng)的氣象預(yù)測方法要快得多。例如,預(yù)測一個臺風(fēng)未來10天的路徑,現(xiàn)在只需要單臺服務(wù)器上單卡配置,10秒內(nèi)就可以獲得更精確的預(yù)測結(jié)果。
在鐵路領(lǐng)域,華為利用盤古大模型成功地優(yōu)化了貨車檢測助手的應(yīng)用,大幅度提高了工作效率。通過引入盤古大模型,列檢員現(xiàn)在只需要檢查過去1/20的列車圖片,這相當(dāng)于提高了20倍的工作效率。
在煤礦領(lǐng)域,盤古礦山大模型已經(jīng)在全國8個礦井規(guī)模使用。它可以覆蓋煤礦的采、掘、機(jī)、運(yùn)、通、洗選等業(yè)務(wù)流程下的1000多個細(xì)分場景,讓煤礦工人的工作環(huán)境更加舒適,同時極大地減少了安全事故的發(fā)生。
在金融領(lǐng)域,盤古大模型與工商銀行合作,提高柜員的工作效率。工行在全國有數(shù)萬個網(wǎng)點(diǎn),20萬網(wǎng)點(diǎn)柜員。盤古金融大模型能根據(jù)客戶的問題,為柜臺工作人員自動生成流程和操作指導(dǎo),將原來需要平均5次的操作降低為1次,辦結(jié)時間縮短5分鐘以上。
此外,華為還將盤古大模型引入到生產(chǎn)制造領(lǐng)域。在過去,制定器件分配計(jì)劃往往需要花費(fèi)3個小時以上才能做齊1天的生產(chǎn)計(jì)劃。但現(xiàn)在,盤古制造大模型學(xué)習(xí)了華為產(chǎn)線上各種器件數(shù)據(jù)、業(yè)務(wù)流程及規(guī)則以后,能夠在1分鐘內(nèi)做出未來3天的生產(chǎn)計(jì)劃。
最后,盤古藥物分子大模型也在藥物研發(fā)領(lǐng)域發(fā)揮著重要作用。它幫助西安交通大學(xué)第一附屬醫(yī)院劉冰教授團(tuán)隊(duì)發(fā)現(xiàn)全球40年來首個新靶點(diǎn)、新類別的抗生素,并將先導(dǎo)藥物研發(fā)周期縮短至1個月、研發(fā)成本降低70%。
目前,華為云的盤古大模型已經(jīng)成功地融入了華為云的產(chǎn)品服務(wù),為華為云的一系列B端產(chǎn)品服務(wù)帶來了升級和重構(gòu)。華為云還提到了盤古大模型在機(jī)器人領(lǐng)域的應(yīng)用,基于盤古大模型的自然語言理解能力,機(jī)器人可以識別自然語言,執(zhí)行命令,并具備全域感知引導(dǎo)的自主智能。用戶只需要用自然語言向機(jī)器人下令,機(jī)器人就可以完成拿取物品等命令,過程中會根據(jù)所處的環(huán)境情況作出自主判斷。
字節(jié)跳動的大模型是基于旗下火山引擎,名字為火山方舟,提供模型訓(xùn)練、推理、評測、精調(diào)等全方位功能與服務(wù)。
與其他大廠不同的是,火山?jīng)]有發(fā)布自己的通用大模型或者行業(yè)大模型,火山方舟聚合了一批第三方生產(chǎn)商開發(fā)的大模型底座?;鹕揭嫦虼竽P蜕a(chǎn)商提供構(gòu)建、訓(xùn)練大模型基座所必須的算力和工具體系,并將這些生產(chǎn)商的大模型聚集到自己的MaaS平臺,供應(yīng)給企業(yè)使用。這與微軟投資算力供給OpenAI,并基于后者開發(fā)的GPT模型向企業(yè)提供Azure AI云服務(wù),有相似之處?!段④?、谷歌搜索巨頭入局!百度能做好類ChatGPT產(chǎn)品嗎?》
因此,火山引擎介紹的合作案例也與其他大廠有所差異。目前公布的合作伙伴,包括英偉達(dá)這樣的上游顯卡供應(yīng)商,以及智譜AI、百川智能、IDEA等當(dāng)下國內(nèi)第一梯隊(duì)的大模型開發(fā)商。
企業(yè)使用大模型,未來也會呈現(xiàn)“1+N”的模式,除了通過自研或深度合作,形成1個主力模型;由于成本和場景復(fù)雜多元等原因,在這個主力模型之外,還會有N個模型同時應(yīng)用。數(shù)字經(jīng)濟(jì)應(yīng)用實(shí)踐專家駱仁童博士解讀到,“火山引擎要做的本質(zhì)上和其他廠商相同,都是要在大模型時代‘賣水’,只是采用形式有所差異。
火山引擎總裁譚待強(qiáng)調(diào):火山方舟最終服務(wù)的是模型的應(yīng)用方;火山引擎是跟大模型的生產(chǎn)方合作,一部分被精選的大模型廠商在火山方舟上部署,然后對外提供服務(wù)。想讓企業(yè)用戶和大模型生產(chǎn)商加入到火山方舟的生態(tài)體系,首先要解決的是數(shù)據(jù)安全的問題。
據(jù)火山引擎智能算法負(fù)責(zé)人吳迪介紹,火山方舟已上線了基于安全沙箱的大模型安全互信計(jì)算方案,利用計(jì)算隔離、存儲隔離、網(wǎng)絡(luò)隔離、流量審計(jì)等方式,實(shí)現(xiàn)了模型的機(jī)密性、完整性和可用性保證,適用于對訓(xùn)練和推理延時要求較低的客戶。
此外,火山方舟還在探索基于NVIDIA新一代硬件支持的可信計(jì)算環(huán)境、基于聯(lián)邦學(xué)習(xí)的數(shù)據(jù)資產(chǎn)分離等多種方式的安全互信計(jì)算方案,更全面地滿足大模型在不同業(yè)務(wù)場景的數(shù)據(jù)安全要求。
總的來說,國內(nèi)的巨頭都在競相研發(fā)和推出自己的大模型產(chǎn)品。這些大模型的商業(yè)價(jià)值主要體現(xiàn)在兩個方面:應(yīng)用賦能和垂直行業(yè)賦能。
應(yīng)用賦能方面,大模型可以被嵌入到各種應(yīng)用中,提高效率和降低成本。垂直行業(yè)賦能方面,大模型可以幫助各個行業(yè)實(shí)現(xiàn)智能化轉(zhuǎn)型。比如,將大型語言模型接入自動化的客戶服務(wù)和流程辦公系統(tǒng),或者用于固定流程、固定模板的輔助工作,都可以顯著地提升效率和降低成本。
然而,大模型的發(fā)展也面臨著一些問題和隱憂。首先是成本問題,訓(xùn)練大型語言模型需要大量的計(jì)算資源和能源消耗,入門門檻也是上億級別的。其次是數(shù)據(jù)隱私和保護(hù)問題,大模型需要收集和使用大量的數(shù)據(jù),并且在訓(xùn)練過程中可能涉及到版權(quán)糾紛等問題。最后是公平性和偏見問題,大模型可能會存在歧視性、非公平性和價(jià)值觀存在偏見等問題,需要采取介入更加公平或者防歧視性以及價(jià)值觀糾偏的算法進(jìn)行矯正跟審計(jì)。
為了解決這些問題和隱憂,需要采取多措并舉的方式。一方面需要研究如何降低計(jì)算資源和能源消耗的問題;另一方面,還需要注重?cái)?shù)據(jù)隱私和保護(hù)問題。
無論如何,隨著華為和字節(jié)的參戰(zhàn),AI大模型會呈現(xiàn)更廣泛的應(yīng)用前景和商業(yè)價(jià)值。然而,隨著其發(fā)展壯大,也面臨著一些挑戰(zhàn)和隱憂,需要各方共同努力來解決。只有通過不斷的創(chuàng)新和發(fā)展,才能讓大模型真正成為推動社會進(jìn)步和發(fā)展的重要力量。
商道童言(Innovationcases)歡迎點(diǎn)贊和分享哦!~~
免費(fèi)電子書:結(jié)構(gòu)化思維?|?荊棘商途?|?年度十詞?|?創(chuàng)新企業(yè)案例?|?區(qū)塊鏈金融
數(shù)字經(jīng)濟(jì)應(yīng)用實(shí)踐專家 駱仁童主講課程
智慧應(yīng)用 |《能源互聯(lián)網(wǎng)》.《新型電力系統(tǒng)》.《智慧建筑》.《智慧機(jī)場》.《智慧交通》.《煙草數(shù)字化》.《智慧城市》.《數(shù)字政府》
數(shù)字應(yīng)用?|?《大數(shù)據(jù)及中臺》.《區(qū)塊鏈》.《元宇宙》
人工智能 |??《人工智能趨勢》.?《ChatGPT新紀(jì)元》
數(shù)字化轉(zhuǎn)型?|《制造業(yè)數(shù)字化》.《零售業(yè)數(shù)字化》?
金融類課程 | 《金融科技創(chuàng)新》.?《商業(yè)銀行變革》?.《數(shù)字人民幣》
思維與技能 |《數(shù)字化管理思維》.《數(shù)字化組織變革》.《用戶思維》
宏觀與趨勢 |《2023宏觀趨勢》.《數(shù)字經(jīng)濟(jì)》.《雙碳戰(zhàn)略》.《新能源汽車》
創(chuàng)新與創(chuàng)業(yè)?|《創(chuàng)業(yè)導(dǎo)師能力提升培訓(xùn)》.《中小企業(yè)賦能》