摘要
本論文旨在研究如何融合多任務學習(Multi-Task Learning, MTL)技術於聲學模型之參數估測,藉以改善會議語音辨識(Meeting Speech Recognition)之準確性。我們的貢獻主要有兩點:1)我們進行了實證研究以充分利用各種輔助任務來加強多任務學習在會議語音辨識的表現。此外,我們還研究多任務與不同聲學模型像是深層類神經網路(Deep Neural Networks, DNN)聲學模型及摺積神經網路(Convolutional Neural Networks, CNN)結合的協同效應,期望增加聲學模型建模之一般化能力(Generalization Capability);2)由於訓練多任務聲學模型的過程中,調整不同輔助任務之貢獻(權重)的方式並不是最佳的,因此我們提出了重新調適法,以減輕這個問題。我們基於在台灣所收錄的中文會議語料庫(Mandarin Meeting Recording Corpus, MMRC)建立了一系列的實驗。與數種現有的基礎實驗相比,實驗結果揭示了我們所提出的方法之有效性。
原文 | 繁體中文 |
---|---|
頁(從 - 到) | 85-103 |
頁數 | 19 |
期刊 | 中文計算語言學期刊 |
卷 | 21 |
發行號 | 2 |
出版狀態 | 已發佈 - 2016 |
Keywords
- 多任務學習
- 深層學習
- 類神經網路
- 會議語音辨識
- Multi-Task Learning
- Deep Learning
- Neural Network
- Meeting Speech Recognition