五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

深藍生成式預訓練語言模型:理論與實戰(zhàn)

2023-07-16 13:38 作者:戰(zhàn)億殤  | 我要投稿

提出基于雙向的Encoder表示。


使用兩個策略:


(1)masked-language-model(MLM),受經(jīng)典的完形填空Cloze task[4]啟發(fā)。這也是絕大多數(shù)預訓練模型所采用并且優(yōu)化的切入點。從語料里mask掉(可以隨機,也可以加入一些知識)一些字詞,試圖準確地預測task掉的內(nèi)容。


(2) next sentence prediction,判斷兩個句子是否具有上下文關系。(貌似在某個地方看到,這個任務沒有決定性的功能,不確定。)


也就是說,GPT只有單向學習;ELMo雖然是雙向學習,但是過于簡單。

BERT雙向學習,并且更加復雜。


?

深藍生成式預訓練語言模型:理論與實戰(zhàn)的評論 (共 條)

分享到微博請遵守國家法律
青川县| 郎溪县| 山西省| 阿城市| 会宁县| 咸宁市| 辽阳市| 乌兰浩特市| 禄丰县| 绵竹市| 惠州市| 将乐县| 赣榆县| 满城县| 拉孜县| 洪湖市| 武穴市| 平邑县| 阿鲁科尔沁旗| 大竹县| 永城市| 句容市| 苗栗市| 和政县| 莱州市| 本溪| 西峡县| 遵义县| 青州市| 东乡族自治县| 荔浦县| 土默特右旗| 石城县| 安宁市| 平阳县| 华蓥市| 根河市| 邢台县| 旺苍县| 涟源市| 石河子市|