5/16/2018 2:47:00 PM
翻譯行業(yè)的大舉動,或將實現實時語音翻譯
對著類似小型手機的翻譯機說話,翻譯機話筒里就會發(fā)出提前設置好的另一種語言的聲音。新華社深圳4月26日電 (記者 王豐)科幻電影《銀河系漫游指南》中,有一種神奇的巴別魚,寄生在主人耳朵里,能自動將周圍人群的腦電波轉換成寄主那種類型的腦電波,于是寄主就能聽懂任何一種人類語言了。
現在,全世界的語音人工智能科學家都在嘗試復制巴別魚,用金屬、芯片和復雜的程序語言來實現“實時語音翻譯”,以期未來能夠取代人工同聲傳譯,而中國科學家們也在進行著積極探索。
日前在深圳舉辦的第六屆中國電子信息博覽會上,中國人工智能公司科大訊飛展示了最新款的巴別魚產品——訊飛翻譯機2.0,這款手持翻譯機不僅支持中文與全球33種語言即時互譯,還支持粵語、四川話、河南話、東北話四種方言口音的識別及中英文離線翻譯。對著類似小型手機的翻譯機說話,翻譯機話筒里就會發(fā)出另一種語言的聲音。
科大訊飛執(zhí)行總裁胡郁介紹,自上世紀40年代計算機誕生之日起,科學家們就開始嘗試機器翻譯。但是由于語言的復雜性和靈活性,雖然經過了70多年的發(fā)展,機器翻譯的質量與人們的期望仍有相當大的差距。
“基于深度學習的神經網絡機器翻譯的出現,讓機器翻譯有了跨越式的進步?!焙粽f,“如何能夠提供更流暢、聽起來更有‘人味’的翻譯,進而能夠取代人工同傳,這是我們的最終目標?!庇嶏w翻譯機2.0不僅支持中文與全球33種語言即時互譯,還支持粵語、四川話、河南話、東北話四種方言口音的識別以及中英文離線翻譯。
2014年9月,神經網絡機器翻譯技術被提出,期望讓機器模擬人腦神經系統(tǒng)。神經網絡的一個重要特性是“從環(huán)境中學習”?;诖耍窠浘W絡翻譯試圖通過對人腦的基本單元——神經元的建模和聯(lián)結,探索建立模擬人腦神經系統(tǒng)功能的神經網絡,使機器具有學習、聯(lián)想、記憶和模式識別等智能信息處理功能。
胡郁介紹,有了人工神經網絡,機器在翻譯的過程中就會先分析和評估句子的特征,再以這些特征作為中介進行翻譯。如此,翻譯自然更為流暢準確。訊飛翻譯機2.0的應用場景
谷歌、微軟及中國的科大訊飛、百度、騰訊等公司都已搭建了自己的神經網絡機器翻譯系統(tǒng)。
“神經網絡翻譯模型在模型結構上模擬了人腦,其中參數的優(yōu)化過程類似人的學習過程?!焙粽f。
2017年的百度世界大會上,百度宣布機器翻譯系統(tǒng)在大學英語六級翻譯考試中得到13.6分(滿分15分),而目前訊飛翻譯機2.0的翻譯準確率也達到了95%以上。這對于復制真正的巴別魚還只是開始。
胡郁說,剩下的5%的問題可能是很致命的,“攻克這5%所花費的代價往往要比攻克95%大得多。”在深圳舉行的第六屆中國電子信息博覽會上,科大訊飛展示自家研發(fā)的翻譯機。
科大訊飛機器翻譯研究主管劉俊華說,雖然目前機器對單個句子的翻譯可以實現流暢和自然,但是在整個篇章的上下文理解方面,機器翻譯并不給力。一旦涉及歇后語、詩句、雙關語甚至口語化的表達,機器翻譯更會掉鏈子。而對于如何將知識融合到機器翻譯系統(tǒng)中,讓機器真正“理解”人類的語言,目前還沒有較好的解決方案。
“如何掌握復雜、多變的‘人性’,或許才是復制一條真正巴別魚的關鍵?!焙粽f。