2018/5/16 14:47:00
翻譯行業(yè)的大舉動,或?qū)崿F(xiàn)實時語音翻譯
對著類似小型手機的翻譯機說話,翻譯機話筒里就會發(fā)出提前設(shè)置好的另一種語言的聲音。新華社深圳4月26日電 (記者 王豐)科幻電影《銀河系漫游指南》中,有一種神奇的巴別魚,寄生在主人耳朵里,能自動將周圍人群的腦電波轉(zhuǎn)換成寄主那種類型的腦電波,于是寄主就能聽懂任何一種人類語言了。
現(xiàn)在,全世界的語音人工智能科學(xué)家都在嘗試復(fù)制巴別魚,用金屬、芯片和復(fù)雜的程序語言來實現(xiàn)“實時語音翻譯”,以期未來能夠取代人工同聲傳譯,而中國科學(xué)家們也在進行著積極探索。
日前在深圳舉辦的第六屆中國電子信息博覽會上,中國人工智能公司科大訊飛展示了最新款的巴別魚產(chǎn)品——訊飛翻譯機2.0,這款手持翻譯機不僅支持中文與全球33種語言即時互譯,還支持粵語、四川話、河南話、東北話四種方言口音的識別及中英文離線翻譯。對著類似小型手機的翻譯機說話,翻譯機話筒里就會發(fā)出另一種語言的聲音。
科大訊飛執(zhí)行總裁胡郁介紹,自上世紀(jì)40年代計算機誕生之日起,科學(xué)家們就開始嘗試機器翻譯。但是由于語言的復(fù)雜性和靈活性,雖然經(jīng)過了70多年的發(fā)展,機器翻譯的質(zhì)量與人們的期望仍有相當(dāng)大的差距。
“基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)機器翻譯的出現(xiàn),讓機器翻譯有了跨越式的進步?!焙粽f,“如何能夠提供更流暢、聽起來更有‘人味’的翻譯,進而能夠取代人工同傳,這是我們的最終目標(biāo)?!庇嶏w翻譯機2.0不僅支持中文與全球33種語言即時互譯,還支持粵語、四川話、河南話、東北話四種方言口音的識別以及中英文離線翻譯。
2014年9月,神經(jīng)網(wǎng)絡(luò)機器翻譯技術(shù)被提出,期望讓機器模擬人腦神經(jīng)系統(tǒng)。神經(jīng)網(wǎng)絡(luò)的一個重要特性是“從環(huán)境中學(xué)習(xí)”?;诖?,神經(jīng)網(wǎng)絡(luò)翻譯試圖通過對人腦的基本單元——神經(jīng)元的建模和聯(lián)結(jié),探索建立模擬人腦神經(jīng)系統(tǒng)功能的神經(jīng)網(wǎng)絡(luò),使機器具有學(xué)習(xí)、聯(lián)想、記憶和模式識別等智能信息處理功能。
胡郁介紹,有了人工神經(jīng)網(wǎng)絡(luò),機器在翻譯的過程中就會先分析和評估句子的特征,再以這些特征作為中介進行翻譯。如此,翻譯自然更為流暢準(zhǔn)確。訊飛翻譯機2.0的應(yīng)用場景
谷歌、微軟及中國的科大訊飛、百度、騰訊等公司都已搭建了自己的神經(jīng)網(wǎng)絡(luò)機器翻譯系統(tǒng)。
“神經(jīng)網(wǎng)絡(luò)翻譯模型在模型結(jié)構(gòu)上模擬了人腦,其中參數(shù)的優(yōu)化過程類似人的學(xué)習(xí)過程。”胡郁說。
2017年的百度世界大會上,百度宣布機器翻譯系統(tǒng)在大學(xué)英語六級翻譯考試中得到13.6分(滿分15分),而目前訊飛翻譯機2.0的翻譯準(zhǔn)確率也達到了95%以上。這對于復(fù)制真正的巴別魚還只是開始。
胡郁說,剩下的5%的問題可能是很致命的,“攻克這5%所花費的代價往往要比攻克95%大得多?!痹谏钲谂e行的第六屆中國電子信息博覽會上,科大訊飛展示自家研發(fā)的翻譯機。
科大訊飛機器翻譯研究主管劉俊華說,雖然目前機器對單個句子的翻譯可以實現(xiàn)流暢和自然,但是在整個篇章的上下文理解方面,機器翻譯并不給力。一旦涉及歇后語、詩句、雙關(guān)語甚至口語化的表達,機器翻譯更會掉鏈子。而對于如何將知識融合到機器翻譯系統(tǒng)中,讓機器真正“理解”人類的語言,目前還沒有較好的解決方案。
“如何掌握復(fù)雜、多變的‘人性’,或許才是復(fù)制一條真正巴別魚的關(guān)鍵。”胡郁說。