概述
作者:胡霞
针对目前普遍存在的英汉电子词典来说,以日语为源语的汉日词典的组织结构要更为复杂。其中的日文汉字、假名混排、交错查找的现象是较为繁琐的问题,也就是说,在汉如电子词典中多数词条都存在着两个关键字。从时间和空间上有效解决日文汉字、假名的双重查询问题是日汉电子词典查询的关键。本文将主要针对这个问题介绍一种方便、实用的日汉电子词典组织结构。
一、源语言分析
日语属于粘着语,它不同于其他语种,主要表现为:
1、 汉字、假名混合排列:
日文不同于中文,在同一篇文章中,汉字和假名同时存在,不同的用户根据个人的习惯,可同时使用汉字或假名书写同一个日文单词,这就要求词典应具备汉字、假名双重查询能力,例如:
わたしは学生です。
也可以写为: 私は学生です。
2、 部分单词书写格式唯一:
虽然日文存在汉字、假名混排现象,但还有大量单词只以汉字或假名一种形式出现,例如:
です、これ —→ 只以假名形式出现;
3、 存在大量同音词:即同音异义词,例如:
がくせい—→学生、楽聖、学制;
じしょ—→辭書、地所、自書、字書;
在词典中,存在大量的同音词,有的词甚至产生几十个同音词,如果词典以单词的读音(即假名)为关键字从词典中查找有关单词,只能找到其中一个,其他词都匹配不上;
4、 存在大量多义词:即读音不同的同形词,例如:
日本—>にほん/にっほん
同样,在词典中存在着大量这种多义词,且这些单词中有些是读音不同,语意相同的,有些是读音不同,语意也不相同的,如果词典以日文汉字为关键字建立索引进行查找,也只能找到其中的一个,其他的都匹配不上;
从上述日语现象分析,日汉电子词典如果分别以日文汉字和假名为关键字进行有序排列,采用日文汉字、假名相结合的查询机制进行搜索将是一种最佳的查询方案。
最后
以上就是想人陪楼房为你收集整理的汉日词典结构的研究(一)---源语言分析的全部内容,希望文章能够帮你解决汉日词典结构的研究(一)---源语言分析所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复