2018/4/25 15:57:00
機器翻譯是如何執(zhí)行的?原理是什么?
近年來,機器翻譯有了長足的進步,這是自然語言處理與人工智能的一次重大飛躍。
所謂的機器翻譯可以看作是如下這張圖:
我們的翻譯機器就是其中帶有問號的黑箱,它的作用就是能夠?qū)⒁粋€語言的序列(如Economic growth has slowed down in recent years)轉(zhuǎn)化成目標語言序列(如La croissance economique sest ralentie ces dernieres annees)。其中翻譯機器在正式工作之前可以利用已有的語料庫(Corpora)來進行學(xué)習(xí)和訓(xùn)練。
所謂的神經(jīng)網(wǎng)絡(luò)機器翻譯就是利用神經(jīng)網(wǎng)絡(luò)來實現(xiàn)上述的黑箱翻譯機器?;谏窠?jīng)網(wǎng)絡(luò)的很多技術(shù)都是從Bengio的那篇開創(chuàng)性論文(一種神經(jīng)網(wǎng)絡(luò)的語言模型)衍生出來的。它的架構(gòu)如下圖所示:
其中,我們用一個神經(jīng)網(wǎng)絡(luò)替換了上圖中的黑箱。在神經(jīng)網(wǎng)絡(luò)中存在著大量的鏈接權(quán)重,這些權(quán)重就是我們要通過數(shù)據(jù)訓(xùn)練、學(xué)習(xí)的參數(shù)。訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)可以將輸入的源語言轉(zhuǎn)換為輸出的目標語言。我們要讓神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的目標就是要能準確的翻譯。這里的準確是指機器生成的語句是比較符合我們?nèi)祟惖恼f話習(xí)慣的。這里的log p(f|e)就是指給定源語言后機器所產(chǎn)生的語言f的概率,我們希望這個概率對于實際的數(shù)據(jù)來說越大越好,這就是所謂的語言模型。
基于神經(jīng)網(wǎng)絡(luò)的機器翻譯模型的一個最大的優(yōu)點就在于它不需要我們用復(fù)雜的特征工程去設(shè)計其過程中的環(huán)節(jié),也就是所謂的End2End(端到端)的模型。這種模型設(shè)計還可以避免中間環(huán)節(jié)的誤差累計。