4/25/2018 2:53:00 PM
機(jī)器翻譯的發(fā)展歷程
機(jī)器翻譯、智能翻譯、人工智能越來越受到廣大人民的喜愛,你知道機(jī)器翻譯是如何發(fā)展的?經(jīng)歷了哪些嗎?
機(jī)器翻譯達(dá)到目前的水平,經(jīng)過了幾十年的發(fā)張,并經(jīng)歷了三次飛躍。
早在1954年,人類就開始嘗試過讓機(jī)器能識(shí)別人類的語(yǔ)言,但直到上世紀(jì)80年代,才有人摸索出方法。當(dāng)時(shí),IBM做了研究,利用一些規(guī)則方法,句法分析,語(yǔ)意分析等傳統(tǒng)方法讓機(jī)器看懂人類語(yǔ)言。但由于當(dāng)時(shí)的人工智能發(fā)展處于“凜冬時(shí)期”,效果一直不好,翻譯質(zhì)量也一直上不去。機(jī)器翻譯的第一個(gè)飛躍也是IBM做出的。IBM的研究人員用了統(tǒng)計(jì)的方法來做機(jī)器翻譯。那時(shí),語(yǔ)音識(shí)別從傳統(tǒng)的人工智能方法專家系統(tǒng)轉(zhuǎn)為統(tǒng)計(jì)學(xué)習(xí)的方法,尤以隱馬爾科夫模型為代表。統(tǒng)計(jì)學(xué)方法的應(yīng)用讓機(jī)器翻譯在上世紀(jì)90年代有了質(zhì)的飛躍。
神經(jīng)機(jī)器翻譯,簡(jiǎn)要的說,就是對(duì)源語(yǔ)言的句子進(jìn)行編碼,即轉(zhuǎn)化為計(jì)算機(jī)可以“理解”的形式,編碼的結(jié)果會(huì)形成很多隱含變量,每個(gè)隱含變量代表從句首到當(dāng)前詞匯為止的語(yǔ)義信息。然后通過一個(gè)解碼的過程,一個(gè)詞、一個(gè)詞輸出譯文。
到了2018年,由微軟亞洲研究院與雷德蒙研究院研發(fā)的機(jī)器翻譯系統(tǒng),解決了NMT方法的一些局限,并借鑒了人類翻譯過程中的一些方式。例如:對(duì)偶學(xué)習(xí)(Dual Learning)、推敲網(wǎng)絡(luò)(Deliberation Networks)、一致性規(guī)范(Agreement Regularization)、聯(lián)合訓(xùn)練(Joint Training)等,讓機(jī)器翻譯水平得到了大大提升。
從機(jī)器翻譯的三次飛躍上不難看出,一家公司構(gòu)建的翻譯系統(tǒng)效果如何,主要取決與兩點(diǎn):一是算法是否足夠好,二是數(shù)據(jù)是否夠全、夠多。
這樣看,對(duì)于大公司來說,他們有足夠優(yōu)秀的人才來搭建神經(jīng)網(wǎng)絡(luò),也有足夠多的搜索數(shù)據(jù)可供自己搭建的網(wǎng)絡(luò)進(jìn)行訓(xùn)練。由于本身在語(yǔ)音識(shí)別上有較長(zhǎng)時(shí)間的積累,自然語(yǔ)言資料庫(kù)上有優(yōu)勢(shì)。
樂文翻譯公司也在不斷完善自己的技術(shù),從語(yǔ)法、專業(yè)性上有了突飛猛進(jìn)的提高,有翻譯服務(wù)相關(guān)的需求,可以隨時(shí)與我公司聯(lián)系,客服熱線:400-895-6679