成人国产在线免播放器最近|久久免费视频2000|日韩精品亚洲精品中文字幕乱伦AV|五月丁香乱伦图一本AV不卡1区

手機號
驗證碼
立即登錄    忘記密碼? 注冊
手機號
郵箱
立即登錄    免費注冊 找回密碼

2018/4/25 15:57:00

機器翻譯是如何執(zhí)行的?原理是什么?

近年來,機器翻譯有了長足的進步,這是自然語言處理與人工智能的一次重大飛躍。

所謂的機器翻譯可以看作是如下這張圖:

我們的翻譯機器就是其中帶有問號的黑箱,它的作用就是能夠?qū)⒁粋€語言的序列(如Economic growth has slowed down in recent years)轉(zhuǎn)化成目標語言序列(如La croissance economique sest ralentie ces dernieres annees)。其中翻譯機器在正式工作之前可以利用已有的語料庫(Corpora)來進行學(xué)習(xí)和訓(xùn)練。

所謂的神經(jīng)網(wǎng)絡(luò)機器翻譯就是利用神經(jīng)網(wǎng)絡(luò)來實現(xiàn)上述的黑箱翻譯機器?;谏窠?jīng)網(wǎng)絡(luò)的很多技術(shù)都是從Bengio的那篇開創(chuàng)性論文(一種神經(jīng)網(wǎng)絡(luò)的語言模型)衍生出來的。它的架構(gòu)如下圖所示:

其中,我們用一個神經(jīng)網(wǎng)絡(luò)替換了上圖中的黑箱。在神經(jīng)網(wǎng)絡(luò)中存在著大量的鏈接權(quán)重,這些權(quán)重就是我們要通過數(shù)據(jù)訓(xùn)練、學(xué)習(xí)的參數(shù)。訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)可以將輸入的源語言轉(zhuǎn)換為輸出的目標語言。我們要讓神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的目標就是要能準確的翻譯。這里的準確是指機器生成的語句是比較符合我們?nèi)祟惖恼f話習(xí)慣的。這里的log p(f|e)就是指給定源語言后機器所產(chǎn)生的語言f的概率,我們希望這個概率對于實際的數(shù)據(jù)來說越大越好,這就是所謂的語言模型。

基于神經(jīng)網(wǎng)絡(luò)的機器翻譯模型的一個最大的優(yōu)點就在于它不需要我們用復(fù)雜的特征工程去設(shè)計其過程中的環(huán)節(jié),也就是所謂的End2End(端到端)的模型。這種模型設(shè)計還可以避免中間環(huán)節(jié)的誤差累計。



閱讀文章:積分+1