教育资源为主的文档平台

当前位置: 查字典文档网> 所有文档分类> 论文> 其他论文> 泛化的基于实例的机器翻译研究

泛化的基于实例的机器翻译研究

上传者:网友
|
翻新时间:2013-12-18

泛化的基于实例的机器翻译研究

泛化的基于实例的机器翻译研究 泛化的基于实例的机器翻译研究 信息技术论文 更新:2006-4-8 阅读: 泛化的基于实例的机器翻译研究

史洪柏 马宪民

摘 要:当今社会处于信息时代Internet 网的迅猛发展,迫切需要通过机器翻译消除不同国籍人们之间的文字障碍。本文提出一种泛化的基于实例的机器翻译,首先通过汉语和英语的语义词典来计算词的语义距离,进而计算语句的结构相似度,然后将相似语句的共同部分提取出来做为模板的候选元素。

关键字:机器翻译(MT) EBMT RBMT 翻译模板

1. 机器翻译的介绍

(1) 基于规则的机器翻译(Rule-based Machine Transltion)

原理:目前一般采用转换文法的方法,先根据原语言的语法规则分析原语言,生成语法树;根据转换规则将其转换成目标语言的语法树,然后根据译文的生成规则生成译文。

特点:灵活,适应性强,但产生的译文质量一般。由于自然语言中存在着大量的例外情况,当规则库比较庞大的时候可能产生很多冲突。规则的调试需要专家知识,非常耗时,并且很难保证修改后的规则不会带来新的冲突。

(2) 基于实例的机器翻译(Example-based Machine Translation)

原理:基于实例的机器翻译的本质是通过类比来获得翻译的结果。给出一系列的汉语对应的源语言和目标语言的语句,将同源语言句子的类似的句子翻译成目标语言。基于实例的机器翻译的假定是:如果一个已经翻译过的语句再次出现,那么它的上一次的翻译结果非常可能也正确。

特点:适用范围窄(受双语语料库规模,题材的限制),如果能匹配成功则译文准确率极高,翻译速度快。对于翻译产品说明书的不同版本能取得很好的效果。

(3) 基于规则和语料库相结合的机器翻译(Hybrid Method)

以Rule_Based Machine Translation为基础,利用从语料库获得的统计信息进行消歧,利用统计的信息和树库做基于统计Parser。

2. 传统的EBMT采用的方法

语句匹配问题:精度匹配和模糊匹配

精度匹配:准确率极高,但是匹配率比较低。译文的质量有保障。

模糊匹配:特点是准确率比较高,匹配率比较好;但是如何根据匹配成功的目标语言的语句来产生译文仍然是一个棘手的问题,可能需要一定程度的深层分析。随着模糊匹配算法的不同,相应的译文生成的策略也不同。

下载文档

版权声明:此文档由查字典文档网用户提供,如用于商业用途请与作者联系,查字典文档网保持最终解释权!

网友最新关注

我是小小推销员
我是小小推销员
我是小小推销员
我是小小推销员
我是小小推销员
我是小小推销员
我是小小推销员
我是小小推销员
我是小小推销员
我是小小推销员
我是小小推销员
我是小小推销员
我是小小推销员
我是小小推销员
我是小小推销员
开会接电话的检讨书范文
个人违纪检讨书
给老婆大人的检讨书
大学生自我批评范文
党员违纪检讨书范文
给领导的检讨书范文
自我批评与反省
司机检讨书范文
犯错学生致老师的检讨书
违反校规的检讨书范文
旷操检讨书范文
保证书兼检讨书
批评家的检讨书
上课犯错的检讨书
党员缺席重要会议检讨书
季节性施工
建筑节能保温工程
建筑公司转正申请书
土建技术员试用期满转正申请书
混凝土结构工程的冬期施工
高层建筑施工
钢筋混凝土结构施工
怎么做好钢筋翻样
电工转正申请书
土建预算员岗位职责
工程部人员转正申请报告
技术员转正工作小结
土建工程师转正申请书
技术员工作转正申请
建筑施工员转正申请书
《吃水不忘挖井人》教学难点
《吃水不忘挖井人》重点字词意思
《吃水不忘挖井人》随堂练习:提高篇
《吃水不忘挖井人》教学重点
《吃水不忘挖井人》作者介绍
《称象》教学重点
《称象》教学难点
《吃水不忘挖井人》重点字词梳理
《称象》教学目标
《吃水不忘挖井人》老师语录
《吃水不忘挖井人》教学目标
《吃水不忘挖井人》整体阅读感知
《吃水不忘挖井人》重点问题探究
《吃水不忘挖井人》随堂练习:巩固篇
《吃水不忘挖井人》美文欣赏:一杯牛奶