基于短语的蒙汉统计机器翻译系统的设计与实现_论文

第 4 O卷 第 1期  21 0 1年 1月  内蒙 古 师 范 大 学 学报 ( 自然 科 学汉 文 版 )   J u n l fI n rM o g l   r lUn v r i ( t r l ce c  ii n   o r a o   n e  n o i No ma   a   i e st Na u a S in e Ed t ) y   o Vo.   o   1 40 N .1 Jn 0 1 a .2 1   基 于 短 语 的 蒙 汉 统 计 机 器 翻 译 系统 的 设 计 与 实 现  银  花  ,王 斯 日古 楞 ,艳  红  (. 1 内蒙 古 师 范 大 学 计 算 机 与 信 息 工 程 学 院 , 蒙 古 呼 和 浩 特 0 0 2 ; 内 1 0 2  2 内 蒙古 国际 蒙 医 医院 , 蒙古 呼 和 浩 特 0 0 2 ) . 内 10 0   摘  要 : 绍 了机 器 翻 译 方 法 和 统 计 翻译 模 型 , 用 国际 开 源 软 件 构 建 了 一 个 基 于 短 语 的 蒙 汉 机 器 翻 译 系  介 利 统 . 步 试 验 结 果 表 明 , 于短 语 翻 译 方 法 的 蒙 汉 机 器 翻译 系统 具 有 较 好 的 翻译 效 果 . 初 基   关 键 词 : 汉 机 器 翻译 ;短 语 翻 译 ; 言 模 型 ;翻译 模 型  蒙 语 中 图 分 类号 :TP 3 1 2  9 .   文 献 标 志 码 :A  文章 编 号 :1 0 —8 3 ( 0 1 0 -0 9 —0   01 7521)1 01 4 基 于短语 的 翻译 方法 是 当前统计 机器 翻译领 域 的主 流技术 之 一. 汉机 器 翻译 就 是利 用计 算 机 程序将  蒙 蒙古语 源语 言文本 自动 翻译 成汉 语 目标 语言 文本. 蒙汉 机器 翻译 系统 的实 现对 蒙古 民族 的繁荣 发 展 和蒙古  民族文化 教育 事业具 有积极 促进 作用 . 本文重 点 阐述基 于短语 的蒙 汉统计 机器 翻译 系统 的设 计与实 现.   1 机 器 翻 译 方 法概 述    机器 翻译方 法大致 可 以分为基 于规则 的方 法 、 于 实例 的方 法 和基于统 计 的方法. 基 随着新 词汇 和新 语言  的不断 出现 , 于规则 的方法 中 , 工指定 的有 限规则 难 以覆盖 大规模 的语 言现象 . 基 人 因此 , 人们 开始使用语 料  库作 为 翻译 知识 的夹 源. 由于语料 规模 的限制 , 于实 例方 法 的命 中率 非 常低 , 但 基 因此 很 多研 究 者不 采用 纯  粹 的基于 实例 的方法.   在 统 计 机 器 翻译 模 型 中 , 基 于 词 、 于 短 语 和 基 于 句 法 的 方 法 . 于 短 语 的 翻 译 模 型 在 翻 译 质 量 上 比  有 基 基 基 于词 的 翻译 模 型提高 了很 多 , 同时 又 比基 于句 法的 翻译 模型 具 有模 型简 单 、 练 和解 码 速度 快 等优 点. 训 因  此 , 几 年 来 基 于 短 语 的 翻 译 模 型 逐 渐 成 为 统 计 机 器 翻译 领 域 的 主 流 方 法 . 近   在 汉蒙机 器 翻译 方 面 , 曾经 开展 了基 于规 则 的面 向政府文 献 的汉蒙 机器辅助 翻译 系统口 、 于 实例的 汉   基 蒙机器 翻译 系统  、 于混 合策 略的汉 蒙机器 翻译 系统[ 和基 于短语 的汉蒙 机器 翻译 系统[ 等方 面 的研究 . ]基 3 ] 4 ]   与汉蒙 机器 翻译 研究 相 比 , 汉 机器 翻 译 的研 究 还 较 少 , 蒙 文献 E ] 用 统计 的方 法 实现 了蒙 汉机 器 翻译 系  s采 统 . 文采 用基 于短 语的统 计机器 翻译 方法进行 蒙 汉机器 翻译 研究. 本   2 基 于 短 语 的 翻 译 模 型    由 于 短 语 翻译 可 以 解 决 歧 义 问 题 和 局 部 排 序 问题 , 多 研 究 者 通 过 使 用 短 语 翻 译 提 高 统 计 机 器 翻 译 系  许 统 的 翻 译 效 果 . 0 2年 , .. h等  首 次 提 出对 数 线 性 模 型 , 模 型 将 融 合 各 种 形 态 知 识 的 特 征 函 数 引 入  20 F J Oc 该 统计 翻译模 型 中 , 并且 自动调 整模 型的特征 权重 , 有效 地 提高 了 系统 的性 能. 在 大 多数 统计 机器 翻译 系 统  现 都 采 用 对 数 线 性 模 型 . 此 基 础 上 , hl   e n等 研 究 人 员 开 发 了 最 早 公 开 的 P aa h统 计 机 器 翻 译 系  在 P ipKo h i h ro 统 , 来 在 P aa h的 基 础 上 开 发 了 目前 最 成 熟 的基 于 短 语 的 统 计 机 器 翻译 系统 Moe . 系统 采用  后 h ro ss 该 F coe 翻译 模 型 , atrd 将语 言的形 态知识 作为 F co 融人 翻译模 型 中, atr 很好 地 提 高 了翻译 效果 . 下面 以蒙 汉短  语翻译为例 , 简单介绍基于短语的统计机器翻译 的一般 翻译过程 : 源语言句子 : ①   收 稿 日期 :2 1 — 7 1   0 00 — 9   型  ;   基 金项 目:国 家 自然 科 学 基 金 资 助 项 目( 1 6 0 4 ;内蒙 古 师 范 大 学 研 究生 创 新 科 研 基 金 项 目( X J 9 5 ) 6031) C J S0 0 4   作 者 简介 :银 花 (9 5 1 8 一) 女 ( 古族 ) 内蒙 古 通辽 市人 , , 蒙 , 内蒙 古 师 范 大 学 硕 士 研究

相关文档

基于短语的藏汉统计机器翻译系统
机器翻译的发展与基于短语的统计机器翻译
基于短语统计翻译的汉维机器翻译系统
基于短语模板对齐的统计机器翻译系统
基于短语统计机器翻译解码算法的研究与实现
对齐模板在标准短语统计机器翻译模型中的应用
一种基于短语统计机器翻译的高效柱搜索解码器
基于短语的统计机器翻译中短语抽取算法改进
基于短语的统计机器翻译中汉维短语对抽取算法改进
基于短语统计机器翻译模型蒙古文形态切分
电脑版