融合多任務學習類神經網路聲學模型訓練於會議語音辨識之研究

楊 明翰, 許 曜麒, 洪 孝宗, 陳 映文(Ying-Wen Chen), 陳 冠宇, 陳 柏琳(Berlin Chen)

Research output: Contribution to journalArticlepeer-review

Abstract

本論文旨在研究如何融合多任務學習(Multi-Task Learning, MTL)技術於聲學模型之參數估測,藉以改善會議語音辨識(Meeting Speech Recognition)之準確性。我們的貢獻主要有兩點:1)我們進行了實證研究以充分利用各種輔助任務來加強多任務學習在會議語音辨識的表現。此外,我們還研究多任務與不同聲學模型像是深層類神經網路(Deep Neural Networks, DNN)聲學模型及摺積神經網路(Convolutional Neural Networks, CNN)結合的協同效應,期望增加聲學模型建模之一般化能力(Generalization Capability);2)由於訓練多任務聲學模型的過程中,調整不同輔助任務之貢獻(權重)的方式並不是最佳的,因此我們提出了重新調適法,以減輕這個問題。我們基於在台灣所收錄的中文會議語料庫(Mandarin Meeting Recording Corpus, MMRC)建立了一系列的實驗。與數種現有的基礎實驗相比,實驗結果揭示了我們所提出的方法之有效性。
Original languageChinese (Traditional)
Pages (from-to)85-103
Number of pages19
Journal中文計算語言學期刊
Volume21
Issue number2
Publication statusPublished - 2016

Cite this