Logo 知识与财富的链接
“v+n+n”结构的哈萨克语短语歧义分析与消解

“v+n+n”结构的哈萨克语短语歧义分析与消解

ISSN:1001-0823
2014年第2期
少数民族语言文字
户冰心[1,2,3] 古丽拉·阿东别克[1,2,3] 祁卉[4] HU Bing-xin,Gulia Altenbek,QI Hui
[1]新疆大学信息科学与工程学院,乌鲁木齐830046 [2]国家语言资源监测与研究中心少数民族语言分中心哈萨克/柯尔克孜语文基地,乌鲁木齐830046 [3]新疆多语种信息技术实验室,乌鲁木齐830046 [4]新疆大学人文学院,乌鲁木齐830046 HU Bing-xin, Gulia Altenbek, QI Hui (1. College of Information Science and Engineering, Xinjiang University, Unmaqi 830046, China;2. The Base of Kazakh and Kirghiz Language of National Language Resource Monitoring and Research Center Minority Languages, Ururnqi 830046, China;3. Xinjiang Laboratory of Multi-language Information Technology, Urumqi 830046, China;4. College of humanity, Xinjiang University, Urumqi 830046, China)

在进行哈萨克语短语识别过程中,存在短语结构歧义的现象。本文通过研究大量的具有歧义的短语结构实例,分析了计算机处理过程中遇到的歧义问题。特别针对“v+n+n”这种最常见的歧义结构,基于哈萨克语语言自身特点,采用条件随机场(CRF)模型进行消歧。实验分析结果表明,该消歧策略可以有效消除歧义。


In the recognition process of Kazakh phrases, the phrase structure ambiguity exists. This paper stud- tional random field (CRF) model to resolve the ambiguity. The experimental results show that the strategy can re- solve the ambiguity effectively.

认领
收 藏
点 赞
认领进度
0 %

发表评论

ISSN:1001-0823
2014年第2期
少数民族语言文字

用户信息设置