2018/6/3 10:37:00
平頂山翻譯公司提供一則報道稱微軟AI的英中翻譯已經可以媲美人工翻譯了
受人類方法啟發(fā)盡管學術界和行業(yè)研究人員多年來一直致力于翻譯工作,但他們最近通過使用一種稱為深度神經網絡的AI系統(tǒng)訓練方法取得了重大突破。這使得他們能夠創(chuàng)造更流利,自然的聲音翻譯,考慮到比以前的方法更廣泛的背景,即統(tǒng)計機器翻譯。
為了達到這個數據集的人類奇偶校驗里程碑,微軟北京和華盛頓州雷德蒙德的三個研究小組共同合作,增加了許多其他培訓方法,使系統(tǒng)更加流暢和準確。
微軟亞洲研究院首席研究經理Tie-Yan Liu表示:“我們的大部分研究都受到人們如何做事的啟發(fā),他領導了一個負責該項目的機器學習團隊。
研究人員還開發(fā)了兩種新技術來提高翻譯的準確性 - 聯合培訓和協(xié)議正規(guī)化。周說,他預計這些方法和技術對于改進其他語言和情況下的機器翻譯也很有用。他表示,他們也可以用來在翻譯之外制作其他的AI突破。
“這是機器翻譯研究可以應用于整個AI研究領域的領域,”他說。沒有“正確”的答案團隊用來達到人類奇偶校驗里程碑的測試集包括來自專業(yè)翻譯的在線報紙樣本中的約2000個句子。
微軟對測試集進行了多輪評估,每次隨機挑選數百個翻譯進行評估。為了驗證微軟的機器翻譯與人的翻譯一樣好,該公司超出了測試集的規(guī)格,并聘請了一群外部雙語語言顧問,將微軟的結果與人工生成的人工翻譯進行比較。
驗證結果的方法突出了教學系統(tǒng)準確翻譯的復雜性。通過語音識別等其他任務,可以很直觀地判斷一個系統(tǒng)的表現是否與一個人一樣好,因為理想的結果對于一個人和一臺機器來說完全相同。研究人員稱這是一種模式識別任務。
“機器翻譯比純粹的模式識別任務復雜得多,”Zhou說。 “人們可以用不同的詞語來表達完全相同的東西,但是你不一定說哪一個更好?!毖芯咳藛T表示,復雜性是機器翻譯如此具有挑戰(zhàn)性的問題,也是如此一個有益的問題。
劉說,沒有人知道機器翻譯系統(tǒng)是否能夠很好地翻譯任何語言對中的任何文本,以及翻譯人員的準確性和抒情性。但是,他說,這些最近的突破允許團隊繼續(xù)邁向實現這一目標的下一個重大步驟,以及AI等其他重大成就,比如在言語 - 語音翻譯方面達到人類平等。
“我們可以預測的是,我們肯定會做得更好,”劉說。