摘要
中文词汇网络(Chinese WordNet,简称CWN)的设计理念,是在完整的知识系统下兼顾词义与词义关系的精确表达与语言科技应用。中文词义的区分与词义间关系的精确表征必须建立在语言学理论,特别是词汇语义学的基础上。而词义内容与词义关系的发掘与验证,则必须源自实际语料。我们采用的方法是分析与语料结合。结合的方式则除了验证与举例外,主要是在大量语料上平行进行词义标记,以反向回馈验证。完整、强健知识系统的建立,是兼顾知识本体(ontology)的完备规范(formal integrity)和人类语言系统内部的完整知识。我们采用了上层共享知识本体(SUMO)来提供知识的规范系统表征。
原文 | 繁體中文 |
---|---|
頁(從 - 到) | 14-23 |
頁數 | 10 |
期刊 | 中文信息學報 |
卷 | 24 |
發行號 | 2 |
出版狀態 | 已發佈 - 2010 |
Keywords
- 计算机应用
- 中文信息处理
- 中文词汇网络
- 全球词汇网络网格
- 知识本体
- 多语处理
- 跨语言整合
- computer application
- Chinese information processing
- Chinese WordNet
- global Wordnet grid
- ontology
- multi-language processing
- cross-lingual integration