Google翻译
body.skin-minerva .mw-parser-output table.infobox caption{text-align:center}
网站类型 | 機器翻譯 |
---|---|
持有者 | |
创始人 | |
网站 | translate.google.com(国际版) translate.google.cn(中国版) |
注册 | No |
现状 | 活躍 |
Google翻譯(英语:Google Translate)是一項Google提供的翻譯文段及網頁的服務。[1]
與其他網站巴別魚、美国在线及雅虎使用SYSTRAN引擎不同的是,Google使用自己開發的翻譯軟件,大部分語言對採用統計機器翻譯技術,少部份語言採用Google神經機器翻譯系統。
至2015年6月,Google翻译稱每天需要處理超過1000億筆字詞;而全世界的人們翻譯最多的單詞是「你好嗎?」、「謝謝」,以及「我愛你」[2]。
目录
1 功能与局限
2 方法
3 翻译语言
3.1 2008年5月以前(按开始提供的时间顺序排列)
3.2 2008年9月25日开始
3.3 2009年1月30日开始
3.4 2009年6月19日开始
3.5 2009年8月25日开始
3.6 2010年1月25日开始
3.7 2010年5月13日开始[8]
3.8 2010年9月25日开始
3.9 2012年2月22日开始
3.10 2012年9月开始
3.11 2013年4月开始
3.12 2013年5月开始
3.13 2013年12月开始
3.14 2014年12月开始
3.15 2016年2月开始
3.16 正在开发的语言
4 整合
4.1 瀏覽器
4.2 字典軟件
4.3 掌上翻译程序/电子词典
5 于中国大陆之现状
6 參見
7 參考資料
8 外部链接
功能与局限
Google翻譯提供即時翻譯功能(即時輸入即時翻譯),使用者可以在左邊的輸入欄位輸入文字,翻譯結果會即時在右邊的結果框顯示。將鼠標移到翻譯結果文字上可以看到其對應的原文。此外,Google翻譯亦提供朗讀功能(包括原文和譯文),使用者亦可查看日文的羅馬拼音、漢字的漢語拼音,甚至韓文拼音等等,功能可算全面。
與其他自動翻譯工具類似,Google翻譯亦有其自身功能侷限。雖然用戶可以通過其幫助來大致理解以外文書寫的文章大意,但Google翻譯服務無法提供準確的譯文,也不能提供可用於出版的內容,例如,它經常會不依據上下文來翻譯詞彙,而且會在翻譯時不遵守語法規則,這是因為其機器翻譯算法與傳統的基於語法分析的算法不同,採用的是基於統計分析的算法。而Google翻译的质量也与语种有关,当源语言是一种欧盟语言,而目标语言是英语时,往往质量较好。2010年的分析显示,法语到英语的翻译相对準確[3],2011年和2012年的分析显示意大利语到英语的翻译同样相对準確[4]。然而,当所翻译的文本较短时,其他规则法机器翻译(rule-based machine translation)却表现得更好,这在中文到英语的翻译中尤为明显[3]。
使用较广泛的语言都有“朗读”功能,对多中心语言而言,朗读采用的口音取决于所在地区,例如:
- 英语:美洲、亚太(香港、马、新除外)及西亚大多使用女声的美国英语,其餘均用女声的英国英语,但澳洲、新西兰和诺福克岛使用一种特殊的大洋洲口音(女声)。
- 西班牙语:美洲使用美洲西班牙语,其餘大部分地區使用卡斯蒂利亚西班牙语。
- 葡萄牙语:除葡萄牙使用本国口音外,其餘大部分地區使用聖保羅口音。
方法
Google翻譯採用的翻譯方法稱作“統計機器翻譯”,具體而言,採用的是基於Franz-Josef Och參加2003年美國國防部高級研究項目局(DARPA)的機器速度翻譯競賽時獲獎的研究成果。Och現在領銜Google機器翻譯小組。
根據Och的說法[5],若想要開發一個可用於翻譯一對全新語言對的統計機器翻譯系統,必須做好如下的數據基礎蒐集才能有保障:一個擁有百萬的單字數量級別的雙語文本語料庫(或者其平行庫集合),以及屬於這兩種語言的單語語料庫,各自得擁有十億以上的單字。然後,用於翻譯這一對語言的機器翻譯結果就會通過這些數據產生的統計模型而得出。
為了獲取這種海量容量的語言學資料,Google採用了聯合國文檔作為語料庫內容來源。[6]由於同樣的一份聯合國文檔通常會有屬於六種聯合國官方語言的譯本,因此,Google如今就擁有了一個相當於經人工翻譯了兩百萬單字的七種語言的語料庫。
而這一點很可能就是Google翻譯之所以一開始專注的是開發英語和阿拉伯語、中文之間的翻譯系統,而非英語和日語或英語和德語這兩對語言之間的翻譯系統的原因。因為阿拉伯語和中文屬於聯合國六種官方語言,而日語、德語不是。
Google的專員卓坤婷曾積極參加在日本舉行的國內會議,在會場上向專家徵集英日兩種語言之間的雙語語料庫。[7]
翻译语言
目前Google支持翻译103种语言。
2008年5月以前(按开始提供的时间顺序排列)
- 英语
- 法语
- 德语
- 西班牙语
- 葡萄牙语
- 意大利语
- 中文(简体)
- 日语
- 韩语
- 俄语
- 阿拉伯语
- 中文(繁体)
- 印地语
- 保加利亚语
- 克罗地亚语
- 捷克语
- 丹麦语
- 芬兰语
- 印地语
- 挪威语
- 波兰语
- 罗马尼亚语
- 瑞典语
2008年9月25日开始
- 加泰罗尼亚语
- 菲律宾语
- 希伯来语
- 印度尼西亚语
- 拉脱维亚语
- 立陶宛语
- 塞尔维亚语
- 斯洛伐克语
- 斯洛文尼亚语
- 乌克兰语
- 越南语
2009年1月30日开始
- 阿尔巴尼亚语
- 爱沙尼亚语
- 加利西亚语
- 匈牙利语
- 马耳他语
- 泰语
- 土耳其语
2009年6月19日开始
- 波斯语
2009年8月25日开始
- 南非荷兰语
- 白俄罗斯语
- 冰岛语
- 爱尔兰语
- 马其顿语
- 马来语
- 斯瓦希里语
- 威尔士语
- 意第绪语
2010年1月25日开始
- 海地克里奥尔语
2010年5月13日开始[8]
- 亚美尼亚语
- 阿塞拜疆语
- 巴斯克语
- 格鲁吉亚语
- 乌尔都语
2010年9月25日开始
拉丁语[9]
2012年2月22日开始
世界语[10]
2012年9月开始
- 老挝语
2013年4月开始
- 高棉语
2013年5月开始
- 波斯尼亚语
- 宿务语
- 苗语
- 爪哇语
- 马拉地语
2013年12月开始
- 豪萨语
- 伊博语
- 毛利语
- 蒙古语
- 尼泊尔语
- 旁遮普语
- 索马里语
- 约鲁巴语
- 祖鲁语
2014年12月开始
- 齐切瓦语
- 哈萨克语
- 马达加斯加语
- 马拉雅拉姆语
- 缅甸语
- 塞索托语
- 僧伽罗语
- 巽他语
- 塔吉克语
- 乌兹别克语
2016年2月开始
- 阿姆哈拉语
- 科西嘉语
- 夏威夷语
- 库尔德语
- 吉尔吉斯语
- 卢森堡语
- 普什图语
- 萨摩亚语
- 苏格兰盖尔语
- 修纳语
- 信德语
- 西弗里斯语
- 科萨语
正在开发的语言
这些语言还没有被Google翻译支持,但在翻译社群中有提供。[11]
- 阿萨姆语
- 粤语
- 切罗基语
- 宗卡语
- 瓜拉尼语
- 卢旺达语
- 中库尔德语
- 奥里亚语
- 罗曼什语
- 塔塔尔语
- 藏语
- 土库曼语
- 维吾尔语
- 沃洛夫语
整合
瀏覽器
划取翻译功能是现代浏览器的重要基础功能,翻译的集成意味着打破文化壁垒,Opera和Firefox的翻译插件亦是利用谷歌翻译API作为扩展程序的核心外部接口。不过当下许多浏览器厂商,在浏览器大战背景下,出于激烈竞争,已经做出了一站式服务,例如Windows10中自带的MicrosoftEdge,微软专门为此定制了浏览器插件版的微软必应翻译。
字典軟件
开发者可以利用谷歌提供的API,对软件集成联网翻译功能。这些软件通常是通过集成翻译功能,实现对原有用途的用户需求满足,所完善而来。例如阅读软件、在线资料搜索时集成的WebJS小程序,由于信息技术的普遍应用和入口之争以及成熟度,目前已不再有着垄断地位,也就不存在增加翻译功能需要收费或是插广告,除非是态度问题,否则一般会作为硬性标准。
掌上翻译程序/电子词典
当今智能手机和平板电脑平台上,亦有很多基於Google翻譯而衍生成的翻译软件。不但在今日动则几十M的软件膨大趋势下做到了体积小巧,而且可以下载离线字典调用,甚至可以翻译屏幕上光标停按的部分。
于中国大陆之现状
2014年5月31日起,Google所有服务(各个IP段)在中国被大规模干扰至今[12],但因为翻译及地图网页版服务有域名后缀为.cn的入口,并且使用了专门设立在中国境内的服务器和IP地址,所以翻译及地图网页版仍然能正常服务。
2017年3月29日起,中国大陆用户可以直接使用Google翻译(手机版)而不需要使用代理。在此之前,翻译需使用代理而无法直接翻译,但下载离线翻译包后可使用离线翻译进行翻译。
2018年8月6日谷歌翻译APP在中国大陆出现了短暂的异常,需使用代理才可正常使用,但异常情况很快恢复了。[13][14]
參見
- 機器翻譯程序
- 統計機器翻譯
- Google產品列表
- 巴別魚
- Windows Live Translator
- Asia Online
- Bing翻譯
參考資料
^ Google Translate. Google. [2009-01-24].
^ 世界滿溫情~Google日翻1千億字 翻最多的竟是我愛你. ETtoday新聞雲. 2015-06-24 [2015-06-27].
^ 3.03.1 Comparison of online machine translation tools. (原始内容存档于2011-02-10).
^ Microsoft Bing Translator and Google Translate Compared. (原始内容存档于2013-11-07).
^ 於2005年機器翻譯峰會上的主旨演講
^ http://www.reuters.com/article/technologyNews/idUSN1921881520070328?feedType=RSS%20target=
^ Google was an official sponsor of the annual Computational Linguistics in Japan Conference ("Gengoshorigakkai") in 2007. Google also sent a delegate from its headquarters to the meeting of the members of the Computational Linguistic Society of Japan in march 2005, promising funding to researchers who would be willing to share text data.
^ Five more languages on translate.google.com. Google. 2010-05-13 (英语).
^ Veni, Vidi, Verba Verti. Google. 2010-09-30 (英语).
^ Tutmonda helplingvo por ĉiuj homoj. Google. 2012-02-22 (英语).
^ Translate Community: Help us improve Google Translate!.
^ Google透明度報告(資訊公開報告). Google. 2014-05-31.
^ 不翻墙也能用了 谷歌翻译优化了中国用户体验
^ 等了八年!谷歌这项重磅服务今天终于可以用了!
外部链接
Google Translate(英文)
Google翻译(简体中文)
Google翻譯(繁体中文)
- Google Trannslate on Google Play
- Google Translate on App Store
- Google translate, statistical machine translation live
|