在进行哈萨克语短语识别过程中,存在短语结构歧义的现象。本文通过研究大量的具有歧义的短语结构实例,分析了计算机处理过程中遇到的歧义问题。特别针对“v+n+n”这种最常见的歧义结构,基于哈萨克语语言自身特点,采用条件随机场(CRF)模型进行消歧。实验分析结果表明,该消歧策略可以有效消除歧义。
In the recognition process of Kazakh phrases, the phrase structure ambiguity exists. This paper stud- tional random field (CRF) model to resolve the ambiguity. The experimental results show that the strategy can re- solve the ambiguity effectively.