翻新时间:2013-12-18
泛化的基于实例的机器翻译研究
泛化的基于实例的机器翻译研究 泛化的基于实例的机器翻译研究 信息技术论文 更新:2006-4-8 阅读: 泛化的基于实例的机器翻译研究
史洪柏 马宪民
摘 要:当今社会处于信息时代Internet 网的迅猛发展,迫切需要通过机器翻译消除不同国籍人们之间的文字障碍。本文提出一种泛化的基于实例的机器翻译,首先通过汉语和英语的语义词典来计算词的语义距离,进而计算语句的结构相似度,然后将相似语句的共同部分提取出来做为模板的候选元素。
关键字:机器翻译(MT) EBMT RBMT 翻译模板
1. 机器翻译的介绍
(1) 基于规则的机器翻译(Rule-based Machine Transltion)
原理:目前一般采用转换文法的方法,先根据原语言的语法规则分析原语言,生成语法树;根据转换规则将其转换成目标语言的语法树,然后根据译文的生成规则生成译文。
特点:灵活,适应性强,但产生的译文质量一般。由于自然语言中存在着大量的例外情况,当规则库比较庞大的时候可能产生很多冲突。规则的调试需要专家知识,非常耗时,并且很难保证修改后的规则不会带来新的冲突。
(2) 基于实例的机器翻译(Example-based Machine Translation)
原理:基于实例的机器翻译的本质是通过类比来获得翻译的结果。给出一系列的汉语对应的源语言和目标语言的语句,将同源语言句子的类似的句子翻译成目标语言。基于实例的机器翻译的假定是:如果一个已经翻译过的语句再次出现,那么它的上一次的翻译结果非常可能也正确。
特点:适用范围窄(受双语语料库规模,题材的限制),如果能匹配成功则译文准确率极高,翻译速度快。对于翻译产品说明书的不同版本能取得很好的效果。
(3) 基于规则和语料库相结合的机器翻译(Hybrid Method)
以Rule_Based Machine Translation为基础,利用从语料库获得的统计信息进行消歧,利用统计的信息和树库做基于统计Parser。
2. 传统的EBMT采用的方法
语句匹配问题:精度匹配和模糊匹配
精度匹配:准确率极高,但是匹配率比较低。译文的质量有保障。
模糊匹配:特点是准确率比较高,匹配率比较好;但是如何根据匹配成功的目标语言的语句来产生译文仍然是一个棘手的问题,可能需要一定程度的深层分析。随着模糊匹配算法的不同,相应的译文生成的策略也不同。
下载文档
网友最新关注
- 第一次坐飞机
- 发生在早晨的一件事
- 第一次炒菜
- 一次激烈的比赛
- 一件新鲜事
- 丢手绢
- 最关心的事
- 闹海
- 天空中的风筝
- 车上的笑话
- 冬运会
- 蜘蛛展
- 我去王府井书店
- 美丽的婺州之夜
- 停电了
- 基于涉外企业行业特征的商务英语教学设想
- 论大学生应加强动物福利观念教育
- 论在科学教学中如何培养学生的创新能力
- 加强毕业论文管理是提高毕业论文质量的重要保证
- 浅析多媒体翻译教学中译者能力的培养
- 高校学生社团的规范管理与科学引导
- 论对新时期高职高专计算机课程教学的思考
- 论规范办公管理 提供优质服务
- 如何有效实施课堂教学中的自由与控制
- 特殊结构家庭子女的社会性发展问题及策略
- 学分制背景下高校德育工作的建构
- 现代班级学生自律行为的生成机制及其操作实践
- 教育良心与教师职业道德价值的实现
- “项目教学法”在程序设计类课程中的实践与探索
- 浅谈如何利用争吵行为促进幼儿社会性发展
- 整合,依存,聚焦──《桥》一课“阅读感悟策略有效性”研究课例⑴
- 阅读教学中感悟策略的灵活运用──《桥》教学案例
- 体验情感与生命──《桥》新课程公开课第二轮教学反思
- 请换一种评价──《桥》教学案例
- 《桥》教后反思
- 有效的朗读预约课堂的精彩──听俞老师的《桥》有感
- 整合,依存,聚焦──《桥》一课“阅读感悟策略有效性”研究课例⑵
- 《桥》教学课例
- 谈教师对文本的解读──《桥》一课教学反思
- 夯实基础知识 提高感悟能力──《桥》教后反思
- 体验、情感、生命──《桥》教学案例
- 《桥》第一课时教学实录
- 实实在在 真真切切──《桥》赏析
- 读出精彩──《桥》教学案例
- 《桥》课例反思