成人国产在线免播放器最近|久久免费视频2000|日韩精品亚洲精品中文字幕乱伦AV|五月丁香乱伦图一本AV不卡1区

手機號
驗證碼
立即登錄    忘記密碼? 注冊
手機號
郵箱
立即登錄    免費注冊 找回密碼

9/11/2018 9:13:00 AM

機器翻譯取代人工翻譯的未來將不是夢

當你心花怒放地在互聯(lián)網(wǎng)上找到自己想要的資料時,面臨一堆堆不熟悉的單詞或符號,會是怎樣一種心情呢?   

 

科技的發(fā)展會匡助我們解決這種尷尬。過去十年來,技術(shù)使機器翻譯得到了革新,通過人工智能計算機,機器翻譯的能力越來越強,利用軟件瀏覽各種語言網(wǎng)站的夢想正在實現(xiàn)。眼下,新的研究還在不斷涌現(xiàn)。最近,南加州大學的科學家們利用軍事中的密碼學,把翻譯視為一種“解碼”過程??茖W家表示,這種技術(shù)不但能翻譯各種語言,甚至能破譯海豚音和“外星人語言”。   

 

發(fā)展過程   

 

近十年才有突破 “科學家從上世紀50年代就開始研究機器翻譯,但長期以來這項研究并未取得大的突破。”南加州大學的計算機科學家凱文·奈特說,最早,他和他的同事采用計算機編碼方式,讓機器進行翻譯,但效果很差,電腦完整翻譯一頁內(nèi)容需要一年時間。   

 

“早期的機器翻譯,比較像字典,計算機僅進行一個字一個字的轉(zhuǎn)換,加上一些簡樸的語法規(guī)則?!惫雀璺g研發(fā)經(jīng)理陳雍昇說,上世紀80年代個人電腦開始普及之后,機器翻譯的技術(shù)才開始有了突破,不僅語法處理變得更為復雜完善,統(tǒng)計式的機器翻譯技術(shù)也初步被使用。   

 

十年前,機器學習的翻譯方式開始泛起,這是一種人工智能,機器自己可以學習,可以像人學外語一樣,逐漸把握語言的規(guī)則模式。凱文此前的同事,南加州大學的首席科學家弗蘭茲·奧切加盟了谷歌公司,令谷歌翻譯上升到新的高度?,F(xiàn)在,在網(wǎng)頁上只要按一個谷歌翻譯鍵,網(wǎng)頁整段文本就會當即變成需要的文字。   

 

“谷歌翻譯是往計算機內(nèi)輸入大量的文字文本,包括原語言的文本,以及對應目標語言人工翻譯的文本,”陳雍昇說,這兩種語言文本,稱為“平行語料”,翻譯公司以為機器會對海量的文本進行學習,查找各種語言模式,通過統(tǒng)計計算得到以為最為正確的翻譯結(jié)果。   

 

“這就似乎聯(lián)合國開會時,機器坐在翻舌人后面看翻舌人怎么翻譯,一邊看,一邊學習,看了好比一萬遍后,機器就知道該怎么翻譯了。”凱文說,他們實驗室所做的主要研究也和谷歌翻譯的類似。   

 

翻譯原理   

 

“機器像猴子一樣智慧”機器在學習過程中也需要老師,此時人類可以告訴機器一些語法規(guī)則。好比,英語中介詞放在句子后面,中文卻在前頭,中文說“我在美國工作”,英語則是“我工作在美國”;阿拉伯語更不同,不是“主謂賓”結(jié)構(gòu),而是“謂主賓”結(jié)構(gòu),更像是“工作我在美國”。一個人很難把握好這些規(guī)律,但只要往計算機中輸入這些規(guī)則后,翻譯機器很快就明白了。   

 

此外,一些詞匯有良多詞義,好比英語中的bank”,可以指“河岸”,也可以指“銀行”。在這種情況下,機器可以通過對上下文的查看做出判定,假如上下文中有“船”這個詞,機器就會翻譯成“河岸”,假如有“取款”這個詞,機器就會翻譯成“銀行”。   

 

凱文說,比較難的情況是碰到中文成語。給外國人講一個成語往往得講完一個故事,但是計算機碰到成語第一次可能比較麻煩,之后就不難了。另外一個難處是比較長的詞匯,在一些語言如芬蘭語中,往往有著超過16個字母的詞語,這時,機器就必需對其進行拆分,然后再進行翻譯。“機器像猴子一樣,很智慧?!眲P文說。   

 

技術(shù)缺陷   

 

“英譯漢好過英譯日”機器翻譯固然已經(jīng)和十年前大不一樣了,但依然存在良多缺陷。統(tǒng)一個系統(tǒng)的語言好比英語和法語,因規(guī)則相近,所以較好翻譯,但不同的語言系統(tǒng)就難了。在凱文等同事的研究中,“英語翻西班牙語很棒,英語翻漢語還行,英語翻日語就很差。”凱文說,“這就像人一樣,我在日本呆了三年,日語仍是不行,但學了兩年漢語后,感覺已經(jīng)可以了?!?  

 

陳雍昇表示,機器翻譯依托龐大的平行語料庫,有時會碰到一種語言和另一種語言之間翻譯語料不足的情況。陳雍昇說,還有良多的技術(shù)難度需要解決,比猶如義詞的判定,如旅“行”和銀“行”的“行”字意義不同,再如分詞的判定,如“假如”和“汽水不假如汁好喝”里的“假如”意思不同,另外,還有同樣內(nèi)容的文檔進行段、句、詞、字的對齊等,都是機器處理的技術(shù)挑戰(zhàn)。   

 

不外,恰是由于機器有著自我學習的聰明,跟著計算機技術(shù)的提高,機器翻譯會變得越來越好。   

 

新方法可破解“外星人語言” 就像一個外語學習的人坐在一大堆外語教材和字典之前一樣,機器學習的基礎(chǔ)就是得有大海一樣的文本材料供其學習。但是世界上有4000種語言,大部門語言是不常用的,沒有那么多的文本,那怎么辦?   

 

同樣是南加州大學的科學家,凱文的同事蘇吉斯·拉維想到了一個新的辦法。   

 

619日至24日在美國俄勒岡舉行的計算機語言學年會上,他提交了一種全新的機器翻譯方法。這種方法叫做“解碼外語”,之所以叫“解碼”,是由于他們把英語視為一種初始語言,需要翻譯的外語類似一種加密后的高級文字,通過解碼破譯,把外語“破解”,變成英語。   

 

在每種語言中,都會有一些常用詞匯,好比漢語里的“這個”、“那個”,這些詞匯泛起的頻率在各種語言中都是最多的;良多詞匯,各種語言都可以互換,將其視為一種加密的詞語;此外,還有少數(shù)詞匯,其他語言中沒有對應,研究者將這三種詞匯列為不同的計算常數(shù),統(tǒng)計比較其泛起的頻率,按照一定的算法進行轉(zhuǎn)換,并通過不斷調(diào)整,得出最佳的翻譯結(jié)果?!巴ㄟ^這種破譯方法,計算機就可以甩掉所有的文本資料,無需進行學習,也無需背負辭海,只要輕裝上陣,像軍事家一樣,就可以把一種新的語言破譯”。   

 

拉維表示,這種翻譯方法目前只能翻譯一些短句或片子字幕,尚未運用到長句或片斷翻譯中,但是,它給機器翻譯打開了一條新的思路,可以運用到任何一種語言中。由于不需要任何既有的文本為基礎(chǔ),這種翻譯方法今后甚至可以對“外星人語言”或“海豚音”進行破譯。   

 

■ 翻譯對比   

 

原文:21世紀什么最寶貴?人才。   

參考翻譯:What is the most expensive commodity in 21st century? Talent。   

谷歌翻譯:What the 21st century the most valuable?Talent。   

愛詞霸翻譯:The 21st century? What is the most important people。   

雅虎翻譯:The 21st century what is most precious? Talented person。   

必應翻譯:What do 21st century most valuable?Talent。   

百度詞典(有道翻譯提供)What is the most precious in the 21st century? Talents。   

 

原文:My love is like a red, red rose,thats newly sprung in June。   

參考翻譯:啊,我的愛人像一朵紅紅的玫瑰,在六月里苞放。   

谷歌翻譯:我的愛就像是一個紅色的,紅色的玫瑰,那是在六月份新涌現(xiàn)。   

愛詞霸翻譯:我的愛是一樣的一個紅色,紅玫瑰,的新彈在六月。   

雅虎翻譯:我的愛是像紅色,紅色rose,that6月最近被反彈。   

必應翻譯:我的愛就像紅色、紅色 rose,that 新開在六月。   

百度詞典(有道翻譯提供):我的愛就像鮮艷的紅玫瑰,六月里迎風初放。   

 

原文:夕暗迫る云の上,いつも一羽で飛んでいる   

參考譯文:暮色蒼莽的云層上,一只悲滄的鷹孤傲地飛翔。   

谷歌翻譯:在晚上封閉黑暗的命運運限,總有一個在恩戴飛的鳥。   

必應翻譯:晚上暗拉說,老是在羽毛飛了。

 

——選自:樂文翻譯

 

樂文翻譯目前是國內(nèi)最大的翻譯機構(gòu)之一,公司秉承“誠信 專業(yè)”的服務(wù)理念,為國內(nèi)外客戶提供一流服務(wù)。了解更多信息:請發(fā)郵箱:abc@lewene.com或直接致電:400-895-6679咨詢。

閱讀文章:積分+1