面向统计机器翻译的双语语料质量评价技术研究
日期:2014.01.01 点击数:3
【类型】学位论文
【作者】杜权
【关键词】 统计机器翻译 数据质量评价 强制解码 数据过滤 双语数据
【学位授予单位】东北大学
【学位年度】2014
【学位名称】硕士
【分类号】TP391.2
【导师姓名】胡明涵
【摘要】由于统计机器翻译是从大规模平行语料中进行统计分析,构建统计模型,进而使用模型进行翻译的统计方法,所以构造高质量统计机器翻译系统的重要基础是大规模高质量的双语平行语料库。但是由于统计机器翻译进行系统训练所需要的语料库非常庞大,并且多数平行语料库中都会包含着大量错误或噪音,它们极大影响着统计机器翻译系统的性能。而我们要想通过人工手段来筛选语料库中的高质量句对又费时费力,因此,通过自动的方法对平行双语语料库进行数据质量检测,以期得到高质量的双语平行句对是很重要的一个研究课题。本文首先改进了基于长度比的数据质量评
【全文挂接】 获取全文
相关文章
- 1、基于小波变换的电能质量检测与仿真分析 作者:吴兆刚 年份:2014
- 2、我国农村民主质量及其影响因素研究 作者:徐巍 年份:2014
- 3、柴达木盆地枸杞质量安全评估与信息系统建立研究 作者:肖明 年份:2014
- 4、批发市场交易模式下农产品质量安全研究 作者:刘小兰 年份:2014
- 5、内部控制质量与企业融资成本的关系研究 作者:孙梦丹 年份:2014
- 6、青少年生命质量量表(YQOL-R)的汉化研究 作者:姜晓莹 年份:2014
热点排行