五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

GPT-4最強(qiáng)模型發(fā)布 | 多模態(tài)模型強(qiáng)勢(shì)升級(jí) | 超級(jí)人工智能時(shí)代來(lái)臨

2023-03-15 22:34 作者:鶴頂禿Web3  | 我要投稿

Technology?& News

據(jù)2023年3月15日凌晨,OpenAI總裁兼聯(lián)合創(chuàng)始人Greg Brockman在Twitter上宣布大型多模態(tài)模型GPT-4正式發(fā)布(圖像和文本輸入,文本輸出),并在功能和對(duì)齊上有明顯的進(jìn)步。

據(jù)OpenAI工程師在視頻中介紹,”GPT-4是世界第一款高體驗(yàn),強(qiáng)能力的先進(jìn)AI系統(tǒng)“與此同時(shí),OpenAI不僅發(fā)布了技術(shù)報(bào)告、System Card,更是直接開放了GPT-4的API,似乎是想一口氣結(jié)束這場(chǎng)“AI爭(zhēng)霸賽”!

Creativity - 創(chuàng)造力

Input:解釋灰姑娘的情節(jié),在一個(gè)句子中,每個(gè)單詞必須從A到Z字母表中的下一個(gè)字母開始,不重復(fù)任何字母。Output如下:

Reasoning Capabilities - 推理能力

Input:安德魯從上午11點(diǎn)到下午3點(diǎn)有空,喬安妮從中午到下午2點(diǎn),然后下午3:30到下午5點(diǎn)自由。漢娜在中午半小時(shí)可用,然后下午4點(diǎn)到6點(diǎn)。對(duì)于安德魯、漢娜和喬安妮來(lái)說(shuō),30分鐘會(huì)議的開始時(shí)間有哪些選擇?Output如下:

? ChatGPT

? GPT-4

Visual Input?- 視覺(jué)輸入

GPT-4可以接受圖像作為輸入,并生成字幕、分類和分析。

Input:我可以用這些食材做什么?

Output:薄烤餅或華夫餅、可麗餅、法式吐司、煎蛋或煎蛋餅、乳蛋餅、奶油凍或布丁、餅干……

Input:這張照片有什么好笑的?逐一描述。

Output:該圖顯示了帶有三個(gè)面板的“Lightning Cable”適配器的包裝。

面板1:智能手機(jī)的充電端口上插有VGA接口(一個(gè)藍(lán)色的15針大接口,通常用于電腦顯示器)。

面板2:“Lightning Cable”適配器的包裝,上面有VGA連接器的圖片。

圖3:VGA連接器的特寫鏡頭,末端有一個(gè)小型Lightning連接器(用于為iPhone和其他蘋果設(shè)備充電)。

這張圖片中的幽默來(lái)自于將一個(gè)大型過(guò)時(shí)的VGA連接器插入一個(gè)小型現(xiàn)代智能手機(jī)充電端口的荒謬。

Longer Context?- 更長(zhǎng)的文案

GPT-4能夠處理超過(guò)25000個(gè)單詞的文本,允許使用長(zhǎng)格式內(nèi)容創(chuàng)建、擴(kuò)展對(duì)話以及文檔搜索和分析等用例。

Input:

描述她在超級(jí)碗的表現(xiàn),以及是什么讓她與眾不同。Output如下:

Safety & Alignment?- 安全與對(duì)齊

? 有人反饋的培訓(xùn)

引入了更多的人類反饋,包括ChatGPT用戶提交的反饋,以改善GPT-4的行為。OpenAI團(tuán)隊(duì)與50多位專家合作,在人工智能安全和安保等領(lǐng)域提供早期反饋。

? 從實(shí)際使用中持續(xù)改進(jìn)

將以前模型的實(shí)際使用經(jīng)驗(yàn)應(yīng)用到GPT-4的安全研究和監(jiān)控系統(tǒng)中。像ChatGPT一樣,隨著越來(lái)越多的人使用GPT-4,團(tuán)隊(duì)將定期更新和改進(jìn)GPT-4。

? GPT-4輔助安全性研究

GPT-4的高級(jí)推理和指令跟蹤功能加快了安全工作。團(tuán)隊(duì)在使用GPT-4幫助創(chuàng)建用于模型微調(diào)的訓(xùn)練數(shù)據(jù),并在訓(xùn)練、評(píng)估和監(jiān)控中迭代分類器。

Built with GPT-4 - 產(chǎn)品構(gòu)建

使用GPT-4開發(fā)創(chuàng)新產(chǎn)品。

Language - 語(yǔ)言能力

許多現(xiàn)有的ML基準(zhǔn)都是用英語(yǔ)編寫的。為了初步了解其他語(yǔ)言的能力,OpenAI團(tuán)隊(duì)使用Azure Translate將MMLU基準(zhǔn)題(包含14000個(gè)選擇題,涉及57個(gè)科目)翻譯成多種語(yǔ)言。在26種測(cè)試語(yǔ)言中的24種中,GPT-4的英語(yǔ)表現(xiàn)優(yōu)于GPT-3.5和其他LLM(Chinchilla、PaLM),包括拉脫維亞語(yǔ)、威爾士語(yǔ)和斯瓦希里語(yǔ)等低資源語(yǔ)言:

Limitations- 局限

盡管GPT-4具有功能,但其局限性與早期GPT模型相似。最重要的是,它仍然不完全可靠(它“幻覺(jué)”了事實(shí)并犯了推理錯(cuò)誤)。

雖然GPT-4仍然是一個(gè)真正的問(wèn)題,但與以前的模型相比,GPT-4顯著減少了幻覺(jué)(這些模型本身在每次迭代中都有所改進(jìn))。在其團(tuán)隊(duì)的內(nèi)部對(duì)抗性真實(shí)性評(píng)估中,GPT-4的得分比其最新的GPT-3.5高40%:

OpenAI團(tuán)隊(duì)已經(jīng)在TruthfulQA等外部基準(zhǔn)上取得了進(jìn)展,該基準(zhǔn)測(cè)試了模型將事實(shí)與一組錯(cuò)誤陳述區(qū)分開來(lái)的能力。

GPT-4的預(yù)測(cè)也有可能是錯(cuò)誤的,在可能出錯(cuò)時(shí)不必仔細(xì)檢查工作。有趣的是,基礎(chǔ)預(yù)訓(xùn)練模型是高度校準(zhǔn)的(其對(duì)答案的預(yù)測(cè)置信度通常與正確的概率相匹配)。然而,通過(guò)當(dāng)前的崗位培訓(xùn)過(guò)程,校準(zhǔn)減少了。

Risks & Mitigations -??風(fēng)險(xiǎn)和緩解措施

GPT-4與以前的模型具有類似的風(fēng)險(xiǎn),例如生成有害建議、錯(cuò)誤代碼或不準(zhǔn)確的信息。然而,GPT-4的額外功能導(dǎo)致了新的風(fēng)險(xiǎn)面。為了了解這些風(fēng)險(xiǎn)的程度,OpenAI團(tuán)隊(duì)邀請(qǐng)了來(lái)自人工智能對(duì)齊風(fēng)險(xiǎn)、網(wǎng)絡(luò)安全、生物風(fēng)險(xiǎn)、信任和安全以及國(guó)際安全等領(lǐng)域的50多名專家對(duì)模型進(jìn)行了對(duì)抗性測(cè)試。例如,收集了額外的數(shù)據(jù),以提高GPT-4拒絕有關(guān)如何合成危險(xiǎn)化學(xué)品的請(qǐng)求的能力。

與GPT-3.5相比,現(xiàn)在的緩解措施顯著改善了GPT-4的許多安全財(cái)產(chǎn)。與GPT-3.5相比,團(tuán)隊(duì)將模型對(duì)不允許內(nèi)容請(qǐng)求的響應(yīng)傾向降低了82%,GPT-4根據(jù)其團(tuán)隊(duì)的策略對(duì)敏感請(qǐng)求(例如,醫(yī)療建議和自我傷害)的響應(yīng)頻率提高了29%。

總體而言,模型級(jí)干預(yù)增加了引發(fā)不良行為的難度,但這樣做仍然是可能的。此外,仍然存在“越獄”來(lái)生成違反我們使用指南的內(nèi)容。目前,重要的是用部署時(shí)間安全技術(shù)來(lái)補(bǔ)充這些限制,如監(jiān)控濫用。OpenAI團(tuán)隊(duì)表示:將分享更多關(guān)于GPT-4和其他人工智能系統(tǒng)潛在的社會(huì)和經(jīng)濟(jì)影響的思考。

Training Process - 培訓(xùn)過(guò)程

與以前的GPT模型一樣,GPT-4基礎(chǔ)模型被訓(xùn)練為預(yù)測(cè)文檔中的下一個(gè)單詞,并使用公開可用的數(shù)據(jù)(如互聯(lián)網(wǎng)數(shù)據(jù))以及我們?cè)S可的數(shù)據(jù)進(jìn)行訓(xùn)練。該數(shù)據(jù)是一個(gè)網(wǎng)絡(luò)規(guī)模的數(shù)據(jù)集,包括數(shù)學(xué)問(wèn)題的正確和錯(cuò)誤解決方案、弱推理和強(qiáng)推理、自相矛盾和一致的陳述,并代表了各種各樣的意識(shí)形態(tài)和思想。

因此,當(dāng)出現(xiàn)問(wèn)題時(shí),基礎(chǔ)模型可以以多種方式做出響應(yīng),而這些方式可能與用戶的意圖相去甚遠(yuǎn)。為了使其與護(hù)欄內(nèi)的用戶意圖保持一致,技術(shù)人員使用帶有人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)來(lái)微調(diào)模型的行為。

請(qǐng)注意,模型的能力似乎主要來(lái)自預(yù)訓(xùn)練過(guò)程。RLHF不會(huì)提高考試成績(jī)(如果沒(méi)有積極的努力,它實(shí)際上會(huì)降低考試成績(jī))。但模型的指導(dǎo)來(lái)自于后訓(xùn)練過(guò)程,基礎(chǔ)模型需要快速的工程設(shè)計(jì),甚至知道它應(yīng)該回答問(wèn)題。

Predictable Scaling - 可預(yù)測(cè)的縮放

GPT-4項(xiàng)目的一大重點(diǎn)是構(gòu)建一個(gè)可預(yù)測(cè)擴(kuò)展的深度學(xué)習(xí)堆棧。主要原因是,對(duì)于GPT-4這樣的大型訓(xùn)練運(yùn)行,進(jìn)行廣泛的特定于模型的調(diào)整是不可行的。其團(tuán)隊(duì)開發(fā)的基礎(chǔ)設(shè)施和優(yōu)化在多個(gè)尺度上具有非常可預(yù)測(cè)的行為。為了驗(yàn)證這種可擴(kuò)展性,通過(guò)從使用相同方法但計(jì)算量少10000倍的模型中進(jìn)行外推,提前準(zhǔn)確預(yù)測(cè)了GPT-4在內(nèi)部代碼庫(kù)上的最終損失,使用的計(jì)算量為萬(wàn)分之一。

現(xiàn)在,OpenAI團(tuán)隊(duì)可以準(zhǔn)確預(yù)測(cè)我們?cè)谟?xùn)練期間優(yōu)化的度量,開始開發(fā)方法來(lái)預(yù)測(cè)更多可解釋的度量。例如,現(xiàn)在可以成功地預(yù)測(cè)了HumanEval數(shù)據(jù)集的一個(gè)子集的通過(guò)率,從計(jì)算量少1000倍的模型中進(jìn)行外推:


有些能力仍然難以預(yù)測(cè)。例如,逆標(biāo)度獎(jiǎng)是一項(xiàng)尋找隨著模型計(jì)算增加而變得更糟的指標(biāo)的競(jìng)賽,事后疏忽是獲獎(jiǎng)?wù)咧?。就像最近的另一個(gè)結(jié)果一樣,GPT-4扭轉(zhuǎn)了這一趨勢(shì):

API -?應(yīng)用程序接口

要訪問(wèn)GPT-4 API,需要注冊(cè)O(shè)penAI的等待名單。其團(tuán)隊(duì)將從今天開始邀請(qǐng)一些開發(fā)商,并逐步擴(kuò)大規(guī)模,以平衡容量和需求。對(duì)研究人工智能或人工智能對(duì)齊問(wèn)題的社會(huì)影響的研究人員準(zhǔn)入計(jì)劃申請(qǐng)補(bǔ)貼準(zhǔn)入。定價(jià)為每1k提示令牌0.03美元,每1k完成令牌0.06美元。默認(rèn)速率限制為每分鐘40k個(gè)令牌,每分鐘200個(gè)請(qǐng)求。其版本也將隨著時(shí)間的推移自動(dòng)更新。

Reasoning Capabilities - 測(cè)試

試試給GPT-4上一道物理題做做。

GPT-4看懂了該題目,并完整解答。

再讓它試試論文總結(jié)摘要。

Conclusion?- 結(jié)語(yǔ)

看到這里,相信大家已經(jīng)對(duì)今天OpenAI剛發(fā)布的GPT-4模型有了一定的認(rèn)識(shí)與了解。未來(lái)人工智能AIGC這場(chǎng)”產(chǎn)業(yè)游戲“到底會(huì)發(fā)展到什么高度?讓我們共同拭目以待吧~按捺不住的小伙伴們可以趕快體驗(yàn)起來(lái)咯!

期待遇見(jiàn)你

? 與我們一起,共創(chuàng)Web3!


掃描上方二維碼,歡迎加入我們!




GPT-4最強(qiáng)模型發(fā)布 | 多模態(tài)模型強(qiáng)勢(shì)升級(jí) | 超級(jí)人工智能時(shí)代來(lái)臨的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
甘肃省| 成安县| 石渠县| 扬州市| 桓台县| 霍邱县| 桐庐县| 得荣县| 仁怀市| 文山县| 贵阳市| 丰县| 安平县| 板桥市| 札达县| 新兴县| 浦城县| 洪洞县| 延长县| 龙山县| 抚远县| 伽师县| 化州市| 望城县| 灵石县| 新津县| 三原县| 池州市| 边坝县| 牡丹江市| 晋州市| 五莲县| 民乐县| 观塘区| 邵武市| 汉源县| 肃宁县| 宁化县| 北流市| 武山县| 潞西市|