融合多任務學習類神經網路聲學模型訓練於會議語音辨識之研究

楊 明翰, 許 曜麒, 洪 孝宗, 陳 映文(Ying-Wen Chen), 陳 冠宇, 陳 柏琳(Berlin Chen)

Research output: Contribution to journalArticle

Abstract

本論文旨在研究如何融合多任務學習(Multi-Task Learning, MTL)技術於聲學模型之參數估測,藉以改善會議語音辨識(Meeting Speech Recognition)之準確性。我們的貢獻主要有兩點:1)我們進行了實證研究以充分利用各種輔助任務來加強多任務學習在會議語音辨識的表現。此外,我們還研究多任務與不同聲學模型像是深層類神經網路(Deep Neural Networks, DNN)聲學模型及摺積神經網路(Convolutional Neural Networks, CNN)結合的協同效應,期望增加聲學模型建模之一般化能力(Generalization Capability);2)由於訓練多任務聲學模型的過程中,調整不同輔助任務之貢獻(權重)的方式並不是最佳的,因此我們提出了重新調適法,以減輕這個問題。我們基於在台灣所收錄的中文會議語料庫(Mandarin Meeting Recording Corpus, MMRC)建立了一系列的實驗。與數種現有的基礎實驗相比,實驗結果揭示了我們所提出的方法之有效性。
Original languageChinese
Pages (from-to)85-103
Number of pages19
Journal中文計算語言學期刊
Volume21
Issue number2
Publication statusPublished - 2016

Cite this

楊明翰, 許曜麒, 洪孝宗, 陳映文(Ying-Wen C, 陳冠宇, & 陳柏琳(Berlin C (2016). 融合多任務學習類神經網路聲學模型訓練於會議語音辨識之研究. 中文計算語言學期刊, 21(2), 85-103.

融合多任務學習類神經網路聲學模型訓練於會議語音辨識之研究. / 楊明翰; 許曜麒; 洪孝宗; 陳映文(Ying-Wen Chen); 陳冠宇; 陳柏琳(Berlin Chen).

In: 中文計算語言學期刊, Vol. 21, No. 2, 2016, p. 85-103.

Research output: Contribution to journalArticle

楊明翰, 許曜麒, 洪孝宗, 陳映文(Ying-WenC, 陳冠宇 & 陳柏琳(BerlinC 2016, '融合多任務學習類神經網路聲學模型訓練於會議語音辨識之研究', 中文計算語言學期刊, vol. 21, no. 2, pp. 85-103.
楊明翰, 許曜麒, 洪孝宗, 陳映文(Ying-WenC, 陳冠宇, 陳柏琳(BerlinC. 融合多任務學習類神經網路聲學模型訓練於會議語音辨識之研究. 中文計算語言學期刊. 2016;21(2):85-103.
楊明翰 ; 許曜麒 ; 洪孝宗 ; 陳映文(Ying-Wen Chen) ; 陳冠宇 ; 陳柏琳(Berlin Chen). / 融合多任務學習類神經網路聲學模型訓練於會議語音辨識之研究. In: 中文計算語言學期刊. 2016 ; Vol. 21, No. 2. pp. 85-103.
@article{44bec0a788174a6cb215081089b6c7a5,
title = "融合多任務學習類神經網路聲學模型訓練於會議語音辨識之研究",
abstract = "本論文旨在研究如何融合多任務學習(Multi-Task Learning, MTL)技術於聲學模型之參數估測,藉以改善會議語音辨識(Meeting Speech Recognition)之準確性。我們的貢獻主要有兩點:1)我們進行了實證研究以充分利用各種輔助任務來加強多任務學習在會議語音辨識的表現。此外,我們還研究多任務與不同聲學模型像是深層類神經網路(Deep Neural Networks, DNN)聲學模型及摺積神經網路(Convolutional Neural Networks, CNN)結合的協同效應,期望增加聲學模型建模之一般化能力(Generalization Capability);2)由於訓練多任務聲學模型的過程中,調整不同輔助任務之貢獻(權重)的方式並不是最佳的,因此我們提出了重新調適法,以減輕這個問題。我們基於在台灣所收錄的中文會議語料庫(Mandarin Meeting Recording Corpus, MMRC)建立了一系列的實驗。與數種現有的基礎實驗相比,實驗結果揭示了我們所提出的方法之有效性。",
keywords = "多任務學習, 深層學習, 類神經網路, 會議語音辨識, Multi-Task Learning, Deep Learning, Neural Network, Meeting Speech Recognition",
author = "明翰 楊 and 曜麒 許 and 孝宗 洪 and 陳, {映文(Ying-Wen Chen)} and 冠宇 陳 and 陳, {柏琳(Berlin Chen)}",
year = "2016",
language = "Chinese",
volume = "21",
pages = "85--103",
journal = "中文計算語言學期刊",
issn = "1027-376x",
publisher = "中華民國計算語言學學會",
number = "2",

}

TY - JOUR

T1 - 融合多任務學習類神經網路聲學模型訓練於會議語音辨識之研究

AU - 楊, 明翰

AU - 許, 曜麒

AU - 洪, 孝宗

AU - 陳, 映文(Ying-Wen Chen)

AU - 陳, 冠宇

AU - 陳, 柏琳(Berlin Chen)

PY - 2016

Y1 - 2016

N2 - 本論文旨在研究如何融合多任務學習(Multi-Task Learning, MTL)技術於聲學模型之參數估測,藉以改善會議語音辨識(Meeting Speech Recognition)之準確性。我們的貢獻主要有兩點:1)我們進行了實證研究以充分利用各種輔助任務來加強多任務學習在會議語音辨識的表現。此外,我們還研究多任務與不同聲學模型像是深層類神經網路(Deep Neural Networks, DNN)聲學模型及摺積神經網路(Convolutional Neural Networks, CNN)結合的協同效應,期望增加聲學模型建模之一般化能力(Generalization Capability);2)由於訓練多任務聲學模型的過程中,調整不同輔助任務之貢獻(權重)的方式並不是最佳的,因此我們提出了重新調適法,以減輕這個問題。我們基於在台灣所收錄的中文會議語料庫(Mandarin Meeting Recording Corpus, MMRC)建立了一系列的實驗。與數種現有的基礎實驗相比,實驗結果揭示了我們所提出的方法之有效性。

AB - 本論文旨在研究如何融合多任務學習(Multi-Task Learning, MTL)技術於聲學模型之參數估測,藉以改善會議語音辨識(Meeting Speech Recognition)之準確性。我們的貢獻主要有兩點:1)我們進行了實證研究以充分利用各種輔助任務來加強多任務學習在會議語音辨識的表現。此外,我們還研究多任務與不同聲學模型像是深層類神經網路(Deep Neural Networks, DNN)聲學模型及摺積神經網路(Convolutional Neural Networks, CNN)結合的協同效應,期望增加聲學模型建模之一般化能力(Generalization Capability);2)由於訓練多任務聲學模型的過程中,調整不同輔助任務之貢獻(權重)的方式並不是最佳的,因此我們提出了重新調適法,以減輕這個問題。我們基於在台灣所收錄的中文會議語料庫(Mandarin Meeting Recording Corpus, MMRC)建立了一系列的實驗。與數種現有的基礎實驗相比,實驗結果揭示了我們所提出的方法之有效性。

KW - 多任務學習

KW - 深層學習

KW - 類神經網路

KW - 會議語音辨識

KW - Multi-Task Learning

KW - Deep Learning

KW - Neural Network

KW - Meeting Speech Recognition

M3 - 文章

VL - 21

SP - 85

EP - 103

JO - 中文計算語言學期刊

JF - 中文計算語言學期刊

SN - 1027-376x

IS - 2

ER -