全部 图书 报纸 期刊 视频 新闻 标准 学位论文 会议论文 图片
首页>质量研究>学位论文>  面向统计机器翻译的双语语料质量评价技术研究

面向统计机器翻译的双语语料质量评价技术研究

日期:2014.01.01 点击数:3

【类型】学位论文

【作者】杜权 

【关键词】 统计机器翻译 数据质量评价 强制解码 数据过滤 双语数据

【学位授予单位】东北大学

【学位年度】2014

【学位名称】硕士

【分类号】TP391.2

【导师姓名】胡明涵

【摘要】由于统计机器翻译是从大规模平行语料中进行统计分析,构建统计模型,进而使用模型进行翻译的统计方法,所以构造高质量统计机器翻译系统的重要基础是大规模高质量的双语平行语料库。但是由于统计机器翻译进行系统训练所需要的语料库非常庞大,并且多数平行语料库中都会包含着大量错误或噪音,它们极大影响着统计机器翻译系统的性能。而我们要想通过人工手段来筛选语料库中的高质量句对又费时费力,因此,通过自动的方法对平行双语语料库进行数据质量检测,以期得到高质量的双语平行句对是很重要的一个研究课题。本文首先改进了基于长度比的数据质量评

【全文挂接】 获取全文

3 0
Rss订阅