五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

書(shū)籍推薦 | 一部不止于技術(shù)的神經(jīng)機(jī)器翻譯“百科全書(shū)”

2022-08-23 23:27 作者:翻譯技術(shù)點(diǎn)津  | 我要投稿


本文友情轉(zhuǎn)載自:博文視點(diǎn)Broadview


2022年7月,Meta(原Facebook)AI 發(fā)布了一個(gè)大規(guī)模機(jī)器翻譯模型NLLB-200,該模型在神經(jīng)網(wǎng)絡(luò)架構(gòu)上混合了稠密和稀疏神經(jīng)網(wǎng)絡(luò),參數(shù)規(guī)模達(dá)545億,在覆蓋202種語(yǔ)言、2440個(gè)語(yǔ)向的180億平行句對(duì)上進(jìn)行訓(xùn)練,訓(xùn)練后的單一模型可支持所有覆蓋語(yǔ)言之間的的自動(dòng)翻譯(即202X201=40602個(gè)語(yǔ)向的互譯)。該模型的名字是英文No Language Left Behind的縮寫(xiě),體現(xiàn)了機(jī)器翻譯實(shí)現(xiàn)世界上所有語(yǔ)言互譯的美好愿景。歷經(jīng)70載,機(jī)器翻譯進(jìn)入深度學(xué)習(xí)驅(qū)動(dòng)時(shí)代機(jī)器翻譯誕生于二十世紀(jì)四五十年代,縱觀機(jī)器翻譯70多年的發(fā)展歷程,從最初的樸素統(tǒng)計(jì)模式,發(fā)展到基于規(guī)則的機(jī)器翻譯、統(tǒng)計(jì)機(jī)器翻譯,再到目前的深度學(xué)習(xí)驅(qū)動(dòng)的神經(jīng)機(jī)器翻譯,不同技術(shù)范式在不同歷史時(shí)期各領(lǐng)風(fēng)騷。


(圖源:https://acutrans.com/top-10-most-commonly-spoken-languages-in-the-world/
目前機(jī)器翻譯的主流技術(shù)范式——神經(jīng)機(jī)器翻譯——是一種基于神經(jīng)網(wǎng)絡(luò)的端到端機(jī)器翻譯模式。區(qū)別于前代的統(tǒng)計(jì)機(jī)器翻譯采用的多步驟級(jí)聯(lián)方式,神經(jīng)機(jī)器翻譯只需要輸入源語(yǔ)言句子,就能直接輸出目標(biāo)語(yǔ)言序列。如下圖所示,其基本思想是利用神經(jīng)網(wǎng)絡(luò)對(duì)源語(yǔ)言進(jìn)行編碼得到源語(yǔ)言的語(yǔ)義表示,然后根據(jù)該語(yǔ)義表示解碼生成目標(biāo)語(yǔ)言。這種端到端模式使模型可以一次性整體訓(xùn)練,既避免了傳統(tǒng)級(jí)聯(lián)方式的錯(cuò)誤傳遞,也大大降低了模型訓(xùn)練和部署的煩瑣程度。


(來(lái)自書(shū)中圖4.1:神經(jīng)機(jī)器翻譯結(jié)構(gòu)示例時(shí)至今日,神經(jīng)機(jī)器翻譯已成為在線(xiàn)機(jī)器翻譯的主要引擎,每天以數(shù)千億單詞量的翻譯規(guī)模服務(wù)全世界各地用戶(hù)。但即便如此,機(jī)器翻譯仍然存在諸多挑戰(zhàn)和難題。一方面,全世界在使用的語(yǔ)言有幾千種,即使像NLLB這樣的大規(guī)模模型,目前也只能覆蓋200余種語(yǔ)言,占比不到已有語(yǔ)言的1/30,大量語(yǔ)言在機(jī)器翻譯版圖里仍然被“Left Behind”。另一方面,神經(jīng)機(jī)器翻譯雖然顯著提升了譯文質(zhì)量,但仍然面臨魯棒性、可解釋性、廣域語(yǔ)境依賴(lài)性、多模態(tài)、資源稀缺等多種挑戰(zhàn)和開(kāi)放問(wèn)題。《神經(jīng)機(jī)器翻譯:基礎(chǔ)、原理、實(shí)踐與進(jìn)階》正是在這樣的背景中寫(xiě)就的。


“百科全書(shū)”式內(nèi)容,展現(xiàn)神經(jīng)機(jī)器翻譯全景視圖該書(shū)為實(shí)踐者總結(jié)已有技術(shù),為研究者梳理前沿進(jìn)展,并站在機(jī)器翻譯歷史發(fā)展的角度,對(duì)比不同機(jī)器翻譯范式,希望讀者能從對(duì)比中窺見(jiàn)技術(shù)發(fā)展的內(nèi)在原因和規(guī)律,以此吸引更多機(jī)器翻譯愛(ài)好者為實(shí)現(xiàn)所有語(yǔ)言互譯的美好愿景添磚加瓦。全書(shū)分為基礎(chǔ)篇、原理篇、實(shí)踐篇和進(jìn)階篇,覆蓋神經(jīng)機(jī)器翻譯的基礎(chǔ)知識(shí)、經(jīng)典框架、原理技術(shù)、實(shí)踐方法與技巧,以及無(wú)監(jiān)督神經(jīng)機(jī)器翻譯、多語(yǔ)言神經(jīng)機(jī)器翻譯、語(yǔ)音與視覺(jué)多模態(tài)機(jī)器翻譯等前沿研究方向。全書(shū)理論與實(shí)踐相結(jié)合,基礎(chǔ)與前沿相交映。


技術(shù)與短評(píng)雙主線(xiàn)敘事,不止于技術(shù)除此之外,本書(shū)的一個(gè)特色是在每一章均附有一篇短評(píng),針對(duì)相應(yīng)章節(jié)的主題,介紹和評(píng)論神經(jīng)機(jī)器翻譯技術(shù)背后的歷史、故事、思想、哲學(xué)、爭(zhēng)議和規(guī)范等。短評(píng)與全書(shū)內(nèi)容相交錯(cuò),使讀者對(duì)神經(jīng)機(jī)器翻譯技術(shù)不僅知其然,而且知其所以然。


適讀人群
本書(shū)適合高等院校計(jì)算機(jī)專(zhuān)業(yè)高年級(jí)本科生,以及人工智能、自然語(yǔ)言處理方向的研究生閱讀,也可供機(jī)器翻譯研究者、實(shí)踐者、使用者,以及機(jī)器翻譯行業(yè)的管理者、人工翻譯研究人員等對(duì)機(jī)器翻譯技術(shù)感興趣的讀者參考。作者介紹


熊德意
天津大學(xué)智能與計(jì)算學(xué)部教授、博士生導(dǎo)師、自然語(yǔ)言處理實(shí)驗(yàn)室負(fù)責(zé)人,天津大學(xué)“語(yǔ)言智能與技術(shù)”中外聯(lián)合研究中心主任,中譯語(yǔ)通-天津大學(xué)自然語(yǔ)言處理聯(lián)合實(shí)驗(yàn)室主任、中譯語(yǔ)通人工智能首席科學(xué)家。主要研究方向?yàn)樽匀徽Z(yǔ)言處理,特別專(zhuān)注于機(jī)器翻譯、對(duì)話(huà)、問(wèn)答、自然語(yǔ)言生成、常識(shí)推理、認(rèn)知計(jì)算等方向的研究。在Computational Linguistics、IEEE TPAMI、AI、AAAI、ACL等國(guó)際著名期刊和會(huì)議上發(fā)表論文100余篇,在Springer出版英文專(zhuān)著一部。獲得國(guó)家自然科學(xué)基金優(yōu)秀青年科學(xué)基金、國(guó)家重點(diǎn)研發(fā)計(jì)劃“政府間國(guó)際科技合作創(chuàng)新合作”重點(diǎn)專(zhuān)項(xiàng)、英國(guó)皇家學(xué)會(huì)牛頓高級(jí)學(xué)者基金等資助。獲得新加坡資訊通信研究院2008年年度研究貢獻(xiàn)獎(jiǎng)、北京市科學(xué)技術(shù)獎(jiǎng)二等獎(jiǎng)、中文信息學(xué)會(huì)“錢(qián)偉長(zhǎng)中文信息處理科學(xué)技術(shù)獎(jiǎng)-漢王青年創(chuàng)新獎(jiǎng)”一等獎(jiǎng)等獎(jiǎng)項(xiàng)。曾是亞洲自然語(yǔ)言處理聯(lián)合會(huì)AFNLP干事、新加坡中文與東方語(yǔ)文信息處理學(xué)會(huì)理事會(huì)成員,目前是中國(guó)中文信息學(xué)會(huì)理事。擔(dān)任IALP 2012&2021程序委員會(huì)共同主席,CWMT 2017程序委員會(huì)共同主席,歐盟多國(guó)聯(lián)合項(xiàng)目QTLeap咨詢(xún)專(zhuān)家,ACL、EMNLP、NAACL、COLING等多個(gè)知名國(guó)際會(huì)議領(lǐng)域主席,以及TACL和ARR的Action Editor等。


李良友
華為諾亞方舟實(shí)驗(yàn)室研究員、機(jī)器翻譯團(tuán)隊(duì)負(fù)責(zé)人。在歐盟瑪麗居里項(xiàng)目資助下,于2017年獲得都柏林城市大學(xué)計(jì)算機(jī)博士學(xué)位。主要研究方向?yàn)樽匀徽Z(yǔ)言處理,特別專(zhuān)注于機(jī)器翻譯相關(guān)技術(shù)領(lǐng)域的研發(fā)。在ACL、EMNLP等多個(gè)國(guó)際著名會(huì)議和期刊上發(fā)表論文10余篇,并擔(dān)任ACL、EMNLP等國(guó)際會(huì)議領(lǐng)域主席和會(huì)議審稿人。


張檬
華為諾亞方舟實(shí)驗(yàn)室研究員。于2018年獲得清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系博士學(xué)位。主要研究方向?yàn)闄C(jī)器翻譯和跨語(yǔ)言自然語(yǔ)言處理。在ACL、EMNLP、AAAI、TASLP等國(guó)際著名會(huì)議和期刊上發(fā)表論文10余篇。曾獲中國(guó)中文信息學(xué)會(huì)優(yōu)秀博士學(xué)位論文提名獎(jiǎng)。擔(dān)任ACL、EMNLP、AAAI、IJCAI等多個(gè)知名國(guó)際會(huì)議審稿人。


- END -


關(guān)注VX公眾號(hào)“翻譯技術(shù)教育與研究”、“語(yǔ)言服務(wù)行業(yè)”,了解更多語(yǔ)言服務(wù)行業(yè)與翻譯技術(shù)相關(guān)的資訊和洞察~

書(shū)籍推薦 | 一部不止于技術(shù)的神經(jīng)機(jī)器翻譯“百科全書(shū)”的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
伊金霍洛旗| 茌平县| 尼玛县| 灯塔市| 苍梧县| 错那县| 丘北县| 灵寿县| 正蓝旗| 陇西县| 淮安市| 遂宁市| 襄樊市| 奎屯市| 炉霍县| 八宿县| 栾城县| 阿拉尔市| 吴桥县| 通许县| 高清| 佳木斯市| 石景山区| 枞阳县| 秦安县| 承德市| 平遥县| 丰顺县| 大姚县| 安阳市| 进贤县| 富民县| 阳西县| 明溪县| 阿坝县| 桐乡市| 建阳市| 富宁县| 手游| 浮梁县| 远安县|