摘要
語言模型是語音辨識系統中的關鍵組成,其主要的功能通常是藉由已解碼的歷史詞序列資訊來預測下一個詞彙為何的可能性最大,以協助語音辨識系統從眾多混淆的候選詞序列假設中找出最有可能的結果。本論文旨在於發展新穎動態語言模型調適技術,用以輔助並彌補傳統N連(N-gram)語言模型不足之處,其主要貢獻有二。首先,我們提出所謂的概念語言模型(Concept Language Model,CLM),其主要目的在於近似隱含在歷史詞序列中語者內心所欲表達之概念,並藉以獲得基於此概念下詞彙使用分布資訊,做為動態語言模型調適之線索來源。其次,我們嘗試以不同方式來估測此種概念語言模型,並將不同程度的鄰近資訊(Proximity Information)融入概念語言模型以放寬其既有詞袋(Bag-of-Words)假設的限制。本論文是以中文大詞彙連續語音辨識(LargeVocabulary Continuous Speech Recognition, LVCSR)為任務目標,以比較我們所提出語言模型調適技術與其它當今常用技術之效能。實驗結果顯示我們的語言模型調適技在以字錯誤率(Character Error Rate, CER)評估標準之下,對於僅使用N連語言模型的基礎語音辨識系統皆能有明顯的效能提升。
原文 | 繁體中文 |
---|---|
頁(從 - 到) | 47-59 |
頁數 | 13 |
期刊 | 中文計算語言學期刊 |
卷 | 19 |
發行號 | 4 |
出版狀態 | 已發佈 - 2014 |
Keywords
- 語音辨識
- 語言模型
- 概念資訊
- 模型調適
- Speech Recognition
- Language Model
- Concept Information
- Model Adaptation