以中文十億詞語料庫為基礎之兩岸詞彙對比研究

洪 嘉馡(Jia-Fei Hong), 黃 居仁(Chu-Ren Huang)

Research output: Contribution to journalArticle

Abstract

近幾年來,由於兩岸交流頻繁,兩岸使用的詞彙,也因此互相影響甚重,語言學界對於漢語詞彙的研究,不論在語音、語義或語用上的探討,發現兩岸對使用相同漢語時的詞彙差異有著微妙性的區別。而兩岸卻又的確是使用漢字體系的書寫系統,只有字形上有可預測的規律性對應。本文在以兩岸皆使用中文文字的原則上,在繁體中文與簡體中文的使用狀況來比對兩岸使用詞彙的特性與現象,以探究與語義對應與演變等相關的議題。首先,在Hong和 Huang(2006)的對應上,藉以英文WordNet為比對標準,藉由比較北京大學的中文概念辭典(Chinese Concept Dictionary(CCD))與中央研究院語言所的中文詞網(Chinese Wordnet(CWN))兩個WordNet中文版所使用的詞彙,探討兩岸對於相同概念詞彙的使用狀況。本文進一步使用中文概念辭典與中文詞網所使用的詞彙,在Gigaword Corpus中繁體語料與簡體語料的相對使用率,探究兩岸對於使用相同詞彙,或使用不同詞彙的現象與分佈情形,並以Google網頁中所搜尋到的繁體資料與簡體資料進行比對、驗證。
Original languageChinese
Pages (from-to)19-34
Number of pages16
Journal中文計算語言學期刊
Volume18
Issue number2
Publication statusPublished - 2013

Cite this

以中文十億詞語料庫為基礎之兩岸詞彙對比研究. / 洪嘉馡(Jia-Fei Hong); 黃居仁(Chu-Ren Huang).

In: 中文計算語言學期刊, Vol. 18, No. 2, 2013, p. 19-34.

Research output: Contribution to journalArticle

@article{82813a34b92e4befad63921cfd06d4eb,
title = "以中文十億詞語料庫為基礎之兩岸詞彙對比研究",
abstract = "近幾年來,由於兩岸交流頻繁,兩岸使用的詞彙,也因此互相影響甚重,語言學界對於漢語詞彙的研究,不論在語音、語義或語用上的探討,發現兩岸對使用相同漢語時的詞彙差異有著微妙性的區別。而兩岸卻又的確是使用漢字體系的書寫系統,只有字形上有可預測的規律性對應。本文在以兩岸皆使用中文文字的原則上,在繁體中文與簡體中文的使用狀況來比對兩岸使用詞彙的特性與現象,以探究與語義對應與演變等相關的議題。首先,在Hong和 Huang(2006)的對應上,藉以英文WordNet為比對標準,藉由比較北京大學的中文概念辭典(Chinese Concept Dictionary(CCD))與中央研究院語言所的中文詞網(Chinese Wordnet(CWN))兩個WordNet中文版所使用的詞彙,探討兩岸對於相同概念詞彙的使用狀況。本文進一步使用中文概念辭典與中文詞網所使用的詞彙,在Gigaword Corpus中繁體語料與簡體語料的相對使用率,探究兩岸對於使用相同詞彙,或使用不同詞彙的現象與分佈情形,並以Google網頁中所搜尋到的繁體資料與簡體資料進行比對、驗證。",
keywords = "兩岸詞彙, 詞義, 概念, CCD, CWN, WordNet, Gigaword Corpus, Google, Cross-Strait Lexical Wordforms, Semantics, Concepts",
author = "洪, {嘉馡(Jia-Fei Hong)} and 黃, {居仁(Chu-Ren Huang)}",
year = "2013",
language = "Chinese",
volume = "18",
pages = "19--34",
journal = "中文計算語言學期刊",
issn = "1027-376x",
publisher = "中華民國計算語言學學會",
number = "2",

}

TY - JOUR

T1 - 以中文十億詞語料庫為基礎之兩岸詞彙對比研究

AU - 洪, 嘉馡(Jia-Fei Hong)

AU - 黃, 居仁(Chu-Ren Huang)

PY - 2013

Y1 - 2013

N2 - 近幾年來,由於兩岸交流頻繁,兩岸使用的詞彙,也因此互相影響甚重,語言學界對於漢語詞彙的研究,不論在語音、語義或語用上的探討,發現兩岸對使用相同漢語時的詞彙差異有著微妙性的區別。而兩岸卻又的確是使用漢字體系的書寫系統,只有字形上有可預測的規律性對應。本文在以兩岸皆使用中文文字的原則上,在繁體中文與簡體中文的使用狀況來比對兩岸使用詞彙的特性與現象,以探究與語義對應與演變等相關的議題。首先,在Hong和 Huang(2006)的對應上,藉以英文WordNet為比對標準,藉由比較北京大學的中文概念辭典(Chinese Concept Dictionary(CCD))與中央研究院語言所的中文詞網(Chinese Wordnet(CWN))兩個WordNet中文版所使用的詞彙,探討兩岸對於相同概念詞彙的使用狀況。本文進一步使用中文概念辭典與中文詞網所使用的詞彙,在Gigaword Corpus中繁體語料與簡體語料的相對使用率,探究兩岸對於使用相同詞彙,或使用不同詞彙的現象與分佈情形,並以Google網頁中所搜尋到的繁體資料與簡體資料進行比對、驗證。

AB - 近幾年來,由於兩岸交流頻繁,兩岸使用的詞彙,也因此互相影響甚重,語言學界對於漢語詞彙的研究,不論在語音、語義或語用上的探討,發現兩岸對使用相同漢語時的詞彙差異有著微妙性的區別。而兩岸卻又的確是使用漢字體系的書寫系統,只有字形上有可預測的規律性對應。本文在以兩岸皆使用中文文字的原則上,在繁體中文與簡體中文的使用狀況來比對兩岸使用詞彙的特性與現象,以探究與語義對應與演變等相關的議題。首先,在Hong和 Huang(2006)的對應上,藉以英文WordNet為比對標準,藉由比較北京大學的中文概念辭典(Chinese Concept Dictionary(CCD))與中央研究院語言所的中文詞網(Chinese Wordnet(CWN))兩個WordNet中文版所使用的詞彙,探討兩岸對於相同概念詞彙的使用狀況。本文進一步使用中文概念辭典與中文詞網所使用的詞彙,在Gigaword Corpus中繁體語料與簡體語料的相對使用率,探究兩岸對於使用相同詞彙,或使用不同詞彙的現象與分佈情形,並以Google網頁中所搜尋到的繁體資料與簡體資料進行比對、驗證。

KW - 兩岸詞彙

KW - 詞義

KW - 概念

KW - CCD

KW - CWN

KW - WordNet

KW - Gigaword Corpus

KW - Google

KW - Cross-Strait Lexical Wordforms

KW - Semantics

KW - Concepts

M3 - 文章

VL - 18

SP - 19

EP - 34

JO - 中文計算語言學期刊

JF - 中文計算語言學期刊

SN - 1027-376x

IS - 2

ER -